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Vorwort des Herausgebers 


Die Fahrzeugtechnik ist kontinuierlich Veränderungen unterworfen. Klima- 
wandel, die Verknappung einiger für Fahrzeugbau und -betrieb benötigter 
Rohstoffe, globaler Wettbewerb, gesellschaftlicher Wandel und das rapide 
Wachstum großer Städte erfordern neue Mobilitätslösungen, die vielfach ei- 
ne Neudefinition des Fahrzeugs erforderlich machen. Die Forderungen nach 
Steigerung der Energieeffizienz, Emissionsreduktion, erhöhter Fahr- und Ar- 
beitssicherheit, Benutzerfreundlichkeit und angemessenen Kosten sowie die 
Möglichkeiten der Digitalisierung und Vernetzung finden ihre Antworten nicht 
aus der singulären Verbesserung einzelner technischer Elemente, sondern be- 
nötigen Systemverständnis und eine domänenübergreifende Optimierung der 
Lösungen. Hierzu will die Karlsruher Schriftenreihe für Fahrzeugsystemtechnik 
einen Beitrag leisten. Für die Fahrzeuggattungen Pkw, Nfz, Mobile Arbeits- 
maschinen und Bahnfahrzeuge werden Forschungsarbeiten vorgestellt, die 
Fahrzeugsystemtechnik auf vier Ebenen beleuchten: das Fahrzeug als komple- 
xes, digitalisiertes mechatronisches System, die Fahrer-Fahrzeug-Interaktion, 
das Fahrzeug in Verkehr und Infrastruktur sowie das Fahrzeug in Gesellschaft 
und Umwelt. Der Energiebedarf eines Kraftfahrzeugs im Betrieb hängt stark 
von der Fahrweise und der Steuerung und Regelung seiner Teilsysteme ab. 
Besonders gute Ergebnisse lassen sich durch vorausschauende Fahr- und Be- 
triebsstrategien erzielen, die aus der Kenntnis vorausliegender Zustände und 
Anforderungen den Regelaufwand minimiert und das System in möglichst 
energiearm realisierbaren Systemzuständen hält. Echtzeitfähige Modelle des 
Fahrzeugs und seiner Teilsysteme und Komponenten erlauben eine Vorhersage 
des Fahrzeugverhaltens, Informationen über die vorausliegende Umgebung des 
Fahrzeugs bilden statische und dynamische Randbedingungen ab, innerhalb 
derer modellprädiktive Optimierungsmethoden die hinsichtlich des Energiebe- 
darfs und anderer Zielgrößen besten Steuerungseingriffe über der Fahrstrecke 
vorhersagen können. Dabei sind aus vielerlei Gründen Unsicherheiten im Spiel, 
verursacht etwa durch unvollständige Modellierung von an der Antriebssteue- 
rung beteiligten Fahrzeugteilsysteme, durch den Verkehr, die Witterung oder 
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das Fahrerverhalten. Letzteres wird auch bei automatisierten Fahrzeugen noch 
lange eine wichtige Rolle spielen, bis autonomes Fahren in allen Situationen 
möglich sein wird. Hier setzt die Arbeit von Herrn Fünfgeld an. Er schlägt 
einen neuen Modellierungsansatz für das Fahrerverhalten vor, in dem aus der 
aktuellen Bewegung des Fahrzeugs stochastische Aussagen über verborgene 
Modellparameter abgeleitet und zur Vorhersage von Wahrscheinlichkeitsvertei- 
lungen der zukünftigen Fahrzeugbewegung genutzt werden. Diese wiederum 
bilden die Basis für eine optimale Regelung von Fahrzeugteilsystemen. Das 
Verfahren erweist sich als leistungsfähig und liefert eine deutliche Verbesserung 
der Regelgüte gegenüber heute üblichen Verfahren. 


Karlsruhe, 26. Juli 2020 Frank Gauterin 
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Die Verbreitung von Fahrerassistenzsystemen und die zunehmende Digitali- 
sierung im Fahrzeugumfeld führen zu einer neuen Anzahl von verfügbaren 
Informationen im Fahrzeug. Die vorausschauende Steuerung und Regelung von 
Fahrzeugsystemen ist ein mögliches Anwendungsfeld für diese Informationen, 
um eine effizientere und intelligentere Steuerung von Fahrzeugsystemen zu 
realisieren. 


Die für die Regelung solcher Systeme benötigten Größen können dabei meist 
nur mittelbar aus den vorhandenen Informationen erzeugt werden. In vielen 
Fällen sind Vorhersagemodelle nötig, um die relevanten Größen abzuleiten. 
Dies ist zum Beispiel der Fall, wenn für die Steuerung des Systems zukünfti- 
ge Fahrzeugdynamikgrößen wie die Geschwindigkeit des Fahrzeugs oder die 
Leistungsanforderung benötigt werden. Um die mit den Vorhersagen verbun- 
dene Unsicherheit zu berücksichtigen, wird in dieser Arbeit ein ganzheitlich 
stochastischer Ansatz zur Generierung von Vorhersagen, basierend auf den 
vorhandenen Umfeldinformationen, abgeleitet. Darauf aufbauend wird die vor- 
ausschauende Regelung von Fahrzeugsystemen mit stochastisch optimalen 
Regelungsverfahren untersucht. Die Gesamtmethode wird an zwei Systembei- 
spielen implementiert und evaluiert. 


Um die Vorhersagegüte und die resultierende Regelgüte ins Verhältnis zu set- 
zen, werden unterschiedliche Vorhersagemodelle als Referenz eingesetzt. Die 
Untersuchungen zeigen, dass die stochastische Vorhersage mit Umfeldinfor- 
mationen bessere Resultate liefert, als eine Vorhersage ohne diese Informa- 
tionen oder ohne Berücksichtigung der Unsicherheiten. Weiterhin zeigt sich 
die Gesamtmethode als geeignet, um neue Funktionalitäten oder effizientere 
Regelungsverfahren für unterschiedliche Fahrzeugsysteme umzusetzen. 


Die in dieser Arbeit vorgestellten Methoden sind Bausteine für die intelligente 
Regelung von Fahrzeugsystemen unter Einbezug von Fahrerverhalten und Um- 
feldinformationen. Die Anwendung und Weiterentwicklung dieser Bausteine 
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ist ein vielversprechendes Forschungsfeld um Fahrzeugsysteme intelligenter 
und effizienter einzusetzen und zu steuern. 


iv 


Abstract 


The progress of advanced driver assistance systems and the digital revolution 
in the vehicular environment lead to an increasing amount of information in the 
single vehicle. Predictive control of vehicle systems is one of the possible fields 
of application for this newly accessible information, enabling more efficient 
and intelligent control of thus systems. 


In most cases of predictive control of a vehicle system, the actually needed 
information has to be derived from the available data. Thus commonly some 
kind of prediction model is needed for this task, e.g. if the control of the system 
requires a forecast of the vehicle dynamics including velocity or traction power. 
To account for the inherit uncertainty when working with predictions, the focus 
of this work is a throughout stochastic approach of modelling and predicting 
vehicle dynamics based on the available information (e.g. predictive street 
data). Based on the stochastic forecasting model, the stochastic optimal control 
of vehicle systems is investigated. The overall framework is applied to and 
evaluated uppon two exemplary vehicle systems. 


To set the prediction accuracy and resulting control performance in perspective, 
several prediction models are used as reference. The results in this work show, 
that stochastic forecasts using information on the vehicle surroundings and 
corresponding control perform better than forecasts without this information 
or such, disregarding the influence of uncertainty. Furthermore the overall 
framework shows to be suited to improve control performance or enable new 
functionalities for existing vehicle systems. 


The methods discussed in this work are enabler for for intelligent control of 
vehicle systems with regard to driver behavior and predictive information. 
Application and further research on those topics is a promising field of research 
to contribute to more intelligent and more efficient system behavior for several 
vehicle systems. 
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1 Einleitung 


Das intelligente Fahrzeug. Was vor wenigen Jahren noch Zukunftsvision war, 
wird — getrieben von den Innovations- und Entwicklungsfeldern in der Auto- 
mobilindustrie — realisierbar. Unter dem Aspekt intelligentes Fahrzeug lassen 
sich dabei drei wichtige, nicht voneinander zu trennende Innovationsfelder 
zusammenfassen: 


= Hochautomatisiertes und autonomes Fahren 
a Das digitalisierte und vernetzte Fahrzeug 
= Intelligente Fahrzeug-Funktionen 


Hochautomatisiertes und autonomes Fahren ist durch Fortschritte in der 
Sensor-Technologie und gesteigerte Rechenressourcen im Fahrzeug auf dem 
Vormarsch. Während Assistenzsysteme älterer Fahrzeuggenerationen rein assis- 
tierende Funktionen ausgeübt haben (z.B. Abstandstempomat und Spurhalteas- 
sistent), übernehmen Assistenzsysteme der aktuellen Generationen die kom- 
plette Fahraufgabe für bestimmte Fahrszenarien (z.B. Autobahn- und Staupilot). 
Damit rückt auch das teilautonome Fahren greifbar nahe an den Serieneinsatz 
(KAB16). Das automatisierte Fahren ist dabei ein wichtiger Treiber der zuneh- 
menden Digitalisierung und Vernetzung des Fahrzeugs (Sal16). Dabei steht 
nicht nur die Vernetzung der Fahrzeuge untereinander sowie mit Back-End- 
Strukturen im Fokus, sondern auch die Vernetzung mit dem Kunden und dessen 
Unterhaltungselektronik (Bur17). Neben automatisierten Fahrfunktionen pro- 
fitiert ein weiteres Anwendungsfeld von der zunehmenden Vernetzung und 
Datenverfügbarkeit: Die intelligenten Fahrzeug-Funktionen. Zu diesen zählt 
zum Beispiel die selbständige Anpassung des Fahrzeugs an sein Umfeld und 
das Fahrerverhalten (Wes17). Die selbständige Anpassung des Fahrzeugs an die 
Fahrsituation kann über die vorausschauende Steuerung von Fahrzeugsystemen 
erfolgen. Unter vorausschauender Steuerung von Fahrzeugsystemen kann dabei 
jede Form der Steuerung eines Systems verstanden werden, die Informationen 
über das Umfeld und die kommenden Fahrsituationen berücksichtigt. 


1 Einleitung 


1.1 Motivation 


Für die vorausschauende Steuerung von Fahrzeugsystemen werden Informatio- 
nen über das Umfeld benötigt. Zentrales Element dieser Umfeldinformationen 
sind die über das Navigationssystem bereit gestellten Kartendaten. Ursprüng- 
lich nur zur Navigation genutzt, wird heutzutage ein Ausschnitt der Kartendaten 
(elektronischer Horizont) über Protokolle wie das ADASIS-Protokoll (siehe 
z.B. (RBB*08)) an das übrige Fahrzeug kommuniziert (Lud12). 


Im Gegensatz zu vielen Fahrerassistenzsystemen können die Anforderungen 
für Fahrzeugsysteme nur mittelbar aus den Kartendaten abgeleitet werden. Um 
die für das System relevanten Informationen zu erhalten, müssen die Karten- 
daten zunächst interpretiert und mit anderen Informationen zusammengeführt 
werden, um die relevanten Informationen (zum Beispiel die zukünftige Ge- 
schwindigkeit des Fahrzeugs) daraus abzuleiten. Diese Ableitung ist dabei 
typischerweise eine Vorhersage und meist unmittelbar mit der Interpretation 
des Fahrerverhaltens bzw. -wunsches verbunden. Bekannte Arbeiten, die sich 
mit dem Thema der vorausschauenden Steuerung von Fahrzeugsystemen befas- 
sen, fokussieren sich dabei auf die Modellierung eines spezifischen Systems 
und die Ermittlung von Potentialen durch die vorausschauende Steuerung. Der 
Aspekt der notwendigen Vorhersage wird dabei häufig nur unzureichend beach- 
tet. Dabei ist dieser ein wichtiger Faktor für die tatsächliche Umsetzbarkeit und 
Zuverlässigkeit solcher Funktionen. Dies ist umso relevanter, da viele Systeme 
einen ähnlichen Informationsbedarf über die voraus liegende Strecke haben und 
die Vorhersage somit ein zentrales Element der vorausschauenden Steuerung 
von Fahrzeugsystemen darstellt. 


Ziel dieser Arbeit ist es daher, sich der vorausschauenden Steuerung von der 
Seite der Vorhersagen zu nähern. Tatsächliche Vorhersagbarkeit und Einfluss 
der Unsicherheit bleibt bei bisherigen Arbeiten häufig außer Acht, da der Fokus 
auf der Systemmodellierung und -steuerung liegt. Folglich soll in dieser Arbeit 
eine systematische Betrachtung der mit Vorhersagen verbundenen Unsicherheit 
und deren Auswirkung auf die Steuerung von Fahrzeugsystemen vorgenommen 
werden. 


1.2 Gliederung der Arbeit 


1.2 Gliederung der Arbeit 


Die vorliegende Arbeit gliedert sich wie folgt: 


In Kapitel 2 werden Arbeiten in der Literatur zu vorausschauenden Anwen- 
dungen im Fahrzeugumfeld sowie die regelungstechnischen Grundlagen der 
vorausschauenden Steuerung erläutert. Neben den Grundlagen der vorausschau- 
enden Steuerung wird auch eine Einführung in das Themengebiet Vorhersagen 
gegeben und die Positionierung der Arbeit erläutert. 


Kapitel 3 behandelt das spezifische Problem der Vorhersage von Fahrzeugdy- 
namikgrößen. Zunächst werden die relevanten Größen der Fahrzeugdynamik 
vorgestellt und ein Literaturüberblick zu den Themen Fahrermodellierung und 
-vorhersagen geben. Auf Basis des Stands der Technik auf dem Gebiet der 
Vorhersagen und der in der Literatur bekannten Vorhersagemodelle wird eine 
neue Methodik zur Vorhersage von Fahrzeugdynamikgrößen erarbeitet. Da- 
bei werden zunächst die einzelnen Aspekte der Modellierung diskutiert und 
anschließend die Adaption der Parameter des Vorhersagemodells mit realen 
Testfahrten untersucht. Anschließend wird eine Methodik zur Erzeugung von 
stochastischen Vorhersagen mittels der vorgestellten Modellierung eingeführt 
und erläutert. Zur Validierung des erarbeiteten Vorhersagemodells werden 
statistische Bewertungskriterien aus dem Gebiet der Vorhersagen herangezo- 
gen und auf das Modell sowie in der Literatur bekannte Referenzverfahren 
angewendet. 


Auf Basis der stochastischen Vorhersage wird in Kapitel 4 die stochastisch 
optimale Regelung von unterschiedlichen Systemklassen thematisiert. Dabei 
werden Lösungsmöglichkeiten des Optimalsteuerungsproblems für Systeme 
mit diskreten und kontinuierlichen Zuständen behandelt. Diese Lösungsverfah- 
ren werden in Verbindung mit den vorgestellten Vorhersagemodellen für zwei 
Anwendungsbeispiele implementiert. Dabei wird zunächst die vorausschauende 
Steuerung einer aktiven Aerodynamik als Systembeispiel mit diskreten Zustän- 
den vorgestellt. Neben der aktiven Aerodynamik wird das Thermomanagement 
einer elektrischen Maschine als weiteres Systembeispiel untersucht. Dafür wird 
zunächst ein vereinfachtes Systemmodell beschrieben sowie die Lösung des 
Optimalsteuerungsproblems für dieses System ausgeführt. Die Zielerreichung 
der daraus resultierenden vorausschauenden Regelung wird für beide System- 
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beispiele mit den zuvor bereits untersuchten Vorhersagemodellen ermittelt und 
bewertet. 


Kapitel 5 fasst die Ergebnisse der vorliegenden Arbeiten zusammen und gibt 
einen Ausblick auf mögliche weiterführende Untersuchungen und Anwen- 
dungsmöglichkeiten. 


2 Grundlagen vorausschauender 
Steuerung und Regelung 


Vorausschauende Regelung ist kein abgegrenztes und klar definiertes Themen- 
gebiet. Im Kontext dieser Arbeit wird der Begriff wie folgt abgegrenzt: 


Eine vorausschauende Steuerung bzw. Regelung ist ein Verfahren, das 
Informationen über den zukünftigen Zustand von Eingangsgrößen des 
Systems (z.B. Wärmeeintrag in einem Kühlsystem) oder zukünftige An- 
derungen von Systemparametern (wie z.B. der Fahrzeugmasse oder des 
Luftwiderstandsbeiwerts) und Randbedingungen (wie z.B. Fahrzeugge- 
schwindigkeit und dadurch zur Verfügung stehendes Kühlpotential) zur 
Steuerung und Regelung des Systems verwendet. 


Vorausschauende Regelungen bedienen sich häufig, jedoch nicht ausschließ- 
lich, der Methodiken der modellprädiktiven Regelung (MPC)!. Bei modell- 
prädiktiver Regelung wird ein dynamisches Modell des zu regelnden Systems 
verwendet, um das Verhalten des Systems in Abhängigkeit von möglichen 
Steuervektoren zu berechnen. Im Sinne der obigen Definition ist MPC aber nur 
dann als vorausschauende Regelung zu verstehen, wenn dabei auch zukünftige 
Randbedingungen oder Eingangsgrößen des fSystems berücksichtigt werden. 
Im Gegensatz zu diesem Anwendungsfall kann MPC auch zur Regelung eines 
komplexen Systems verwendet werden, ohne zukünftige Randbedingungen 
zu berücksichtigen oder nur unter der vereinfachenden Annahme konstanter 
Randbedingungen einzubeziehen. In diesem Fall wird nur das Systemverhalten 
selbst prädiziert, um eine komplexe Regelungsaufgabe zu lösen (Bsp.: Auf- 
schwingen und Stabilisieren eines inversen Pendels (MWNO9)). Neben MPC 
sind auch andere Verfahren, wie zum Beispiel regelbasierte Verfahren, für 
die vorausschauende Regelung einsetzbar. Im folgenden Abschnitt wird zu- 
nächst ein Überblick über bekannte Anwendungen vorausschauender Regelung 


! Model Predictive Control 


2 Grundlagen vorausschauender Steuerung und Regelung 


im Fahrzeugkontext gegeben, bevor die Grundlagen der modellprädiktiven 
Regelung näher erläutert werden. 


2.1 Vorausschauende Regelung im 
Fahrzeugkontext 


2.1.1 Regelung des Fahrzeugs 


Im Fahrzeugkontext ist vorausschauende Regelung besonders im Bereich des 
assistierten und automatisierten Fahrens von Bedeutung. Diese Problemstel- 
lung wird in dieser Arbeit allerdings nicht tiefgehend behandelt. Da viele 
Herausforderungen beim automatisierten Fahren aber ähnlich mit denen der 
vorausschauenden Steuerung von Fahrzeugsystemen sind, wird an dieser Stelle 
ein kurzer Überblick über das Themengebiet gegeben. 


Die echtzeitfähige Trajektorienplanung und -regelung für die Längs- und Quer- 
führung des Fahrzeugs wird beispielsweise in (Wer10) und (Bau19) themati- 
siert. In (Wah15) wird für den Entwurf eines effizienten Fahrerassistenzsystems 
die Längsführung des Fahrzeugs in Kombination mit der Energiemanagement- 
strategie eines Hybridfahrzeugs betrachtet. Die Herausforderungen solcher 
und ähnlicher Problemstellungen liegen dabei vor allem in der Mehrdimensio- 
nalität des Zustandsraums des Systems und der Berücksichtigung komplexer 
Beschränkungen von Systemzuständen und Steuergrößen. In vielen Fällen 
wird die Sollvorgabe (Bsp.: Fahrtrajektorie) durch ein Optimierungsverfahren 
ermittelt. Die Trajektorienfolgeregelung und Stabilisierung des Systems kann 
durch MPC, aber auch andere Verfahren erfolgen (siehe z.B. (PCY *16)). 


Neben der Planung und Regelung des Fahrzeugs in statischer Umgebung ist 
das Verhalten in dynamischen Umgebungen eine der aktuellen Herausfor- 
derungen auf dem Gebiet des höher automatisierten Fahrens. Hierzu zählen 
beispielsweise Situationen mit anderen Verkehrsteilnehmern wie zum Beispiel 
an Kreuzungen und Kreisverkehren, Spurwechsel in dichtem Verkehr oder 
auch die Reaktion auf Fußgänger und andere dynamische Hindernisse (vgl. 
(CLS*+15, OJK*16)). Die Herausforderungen in der Beherrschung solcher 
Situationen unterscheiden sich zum Teil deutlich von der klassischen Trajek- 
torienplanung. Neben der Komplexität der eigentlichen Pfad- und Trajektorien- 
planung kommen zusätzliche Schwierigkeiten durch Verhaltensinterpretation 
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2.1 Vorausschauende Regelung im Fahrzeugkontext 


und -vorhersage, Berücksichtigung von Interaktionen und Planung in unsicherer 
Umgebung hinzu. 


2.1.2 Regelung von Fahrzeugsystemen 


Vorausschauende Regelung hat auch auf dem Gebiet der Steuerung von Fahr- 
zeugsystemen unterschiedliche Anwendungsfelder. Besondere Aufmerksam- 
keit hat dabei das Energiemanagement von Hybridfahrzeugen bekommen. Wäh- 
rend frühe Ansätze hauptsächlich auf heuristische Strategien zurückgegriffen 
haben (siehe z.B. (Bus96, Sei00)), finden sich in neueren Arbeiten vermehrt 
optimalsteuerungsbasierte Ansätze (vgl. (Wah15, Bac05, AG09, Maal5)). Ziel 
einer vorausschauenden Energiemanagementstrategie ist dabei die verfügbare 
elektrische Energie bzw. den Energiespeicher intelligent zu nutzen, um den 
Kraftstoffverbrauch des Fahrzeugs zu reduzieren. 


Neben dem klassischen Hybrid- bzw. PlugIn-Hybridfahrzeug, wird voraus- 
schauende Regelung auch bei Elektrofahrzeugen mit zwei elektrischen Energie- 
speichern (Batterie und Superkondensator) untersucht (vgl. (GA17, GTKD17, 
SHL* 15, ZXS17)). Der Superkondensator dient dabei dem Ausgleich der kur- 
zen hohen Lastspitzen, während die Batterie die primäre Energiequelle für den 
dauerhaften Leistungsbedarf darstellt. Eine vorausschauende Energiemanage- 
mentstrategie kann dabei helfen, die notwendigen Stromspitzen der Batterie 
und damit deren Alterungseffekte zu minimieren. 


Ein weiteres Anwendungsgebiet für vorausschauende Regelung ist das Thermo- 
management des Kraftfahrzeugs. Bei konventionellen Fahrzeugen ist die vor- 
ausschauende Kühlsystemregelung schon länger im Fokus und wird z.B. in 
(Goß09), (BLEK10) und (GS12) thematisiert. Ziel einer solchen Regelung ist 
das Anheben der mittleren Bauteiltemperaturen, ohne dass die dabei auftreten- 
den Spitzentemperaturen die Auslegungsgrenzen der Bauteile überschreiten 
(GS12). Weiterhin kann die vorausschauende Absenkung des Temperaturni- 
veaus für besseres Ansprechverhalten und damit eine gesteigerte Dynamik 
genutzt werden (BLEK10). Durch die zunehmende Bedeutung rein elektrisch 
angetriebener Fahrzeuge (E-Fahrzeuge) werden auch im elektrischen Antriebs- 
strang die Verbesserungspotentiale durch vorausschauendes Thermomanage- 
ment untersucht (siehe z.B. (Aue15)). Besonderer Fokus liegt hierbei auf der 
Steigerung der Reichweite des E-Fahrzeugs durch Reduktion des Gesamtener- 
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giebedarfs. In (Auel5) werden hierfür Maßnahmen zur Vorkonditionierung 
des Fahrzeugs, aber auch die adaptive Regelung während der Fahrt durch vor- 
ausschauende Adaption von Regelparametern diskutiert. Von (AEJ17) wird 
weiterhin ein vorausschauender Ansatz zur elektrischen und thermischen Rege- 
lung eines Batteriepacks vorgestellt. 


Weitere mögliche Anwendungsgebiete für vorausschauende Steuerungen und 
Regelungen sind zum Beispiel das Leistungsmanagement in Fahrzeugbordnet- 
zen ((Koh13)) oder vorausschauende Schaltstrategien für Automatikgetriebe 
(vgl. (NHSS11, RSA14)). 


Für die oben genannten Anwendungsbeispiele werden vor allem Größen be- 
nötigt, die nur mittelbar aus den Umgebungsinformationen abgeleitet wer- 
den können. Im Fall des Energiemanagements sind dies beispielsweise die 
Fahrzeuggeschwindigkeit v, die Fahrzeuglängsbeschleunigung a, und die Rad- 
leistungsanforderung Pr (siehe z.B. (Bac05, AG09, BRD*10, Maal5)). Die 
Anwendung von optimalsteuerungsbasierten Ansätzen für vorausschauende 
Regelungen erfordert somit die Vorhersage von Umgebungsgrößen. In die- 
sem Punkt unterscheidet sich die vorausschauende Steuerung maßgeblich von 
klassischer MPC. Bei klassischer modellprädiktiver Regelung wird nur die Sys- 
temreaktion auf zukünftige Steuergrößen prädiziert, die Umgebungseinflüsse 
werden aber als konstant angenommen. Die Unsicherheit der Vorhersage ist 
hier somit auf Modell- und Messunsicherheiten beschränkt. 


Die Notwendigkeit einer Vorhersage für die vorausschauende Steuerung wirft 
zwei grundlegende Fragen auf: 


= Welche Möglichkeiten gibt es, mit der Unsicherheit 
einer Vorhersage umzugehen? 

= Welche Auswirkungen hat die Unsicherheit auf die Formulierung 
bzw. Lösung des Optimalsteuerungsproblems? 


Bekannte Arbeiten auf dem Gebiet befassen sich häufig mit der Modellie- 
rung des Systems und dem Entwurf und der Potentialuntersuchung einer vor- 
ausschauenden Regelung. Die Vorhersageproblematik wird dabei oft außer 
Acht gelassen, beispielsweise durch Annahme bekannter Zukunft (siehe z.B. 
(NHSS11, Aue15)) oder als Gegenstand zukünftiger Forschungsinteressen be- 
nannt (vgl. (Bac05)). 


2.2 Optimalsteuerung und modellprädiktive Regelung 


Regelungsverfahren mit einer expliziten Berücksichtigung der Unsicherheit 
wurden bisher vor allem am Energiemanagement von Hybridfahrzeugen un- 
tersucht (vgl. (BRD*10, DBBK14, JAE07, MFCS11, RBD*10)). Die Kom- 
plexität der Lösungssuche des stochastischen Problems kann dabei signifikant 
höher sein als bei einer deterministischen Problemformulierung. In zahlrei- 
chen dieser Arbeiten wird das Fahrerverhalten bzw. die Vorhersagegröße über 
eine Markov-Ketten-Formulierung abgebildet bzw. vorhergesagt (siehe z.B. 
(BRD* 10, LPG04, DBBK14, KF09)). 


Um den Zusammenhang und die Relevanz von Unsicherheiten im Zusam- 
menhang mit vorausschauender Steuerung zu erörtern, werden im Folgenden 
zunächst die Grundlagen der Optimalsteuerung und modellprädiktiven Rege- 
lung sowie Vorhersagen im Allgemeinen behandelt. 


2.2 Optimalsteuerung und modellprädiktive 
Regelung 


Modellprädiktive Regelung wurde in den 1980er Jahren besonders in der Steue- 
rung von Großanlagen der Chemie- und Ölindustrie populär (ML99, QB03). 
Die dabei adressierten Problemstellungen zeichnen sich durch mehrdimensiona- 
le Regelungsprobleme mit vielen Ein- und Ausgangsgrößen sowie komplexen 
Systembeschränkungen aus, die bis dahin durch viele verschachtelte und ver- 
bundene Regelkreise gesteuert wurden. Heutzutage wird modellprädiktive 
Regelung auf zahlreichen Anwendungsgebieten eingesetzt. Ein Überblick über 
die historische Entwicklung und Methoden von MPC findet sich unter anderem 
in (May14) und (ML99). 


Bei MPC wird das Systemverhalten üblicherweise durch eine zeitdiskrete 
Ubertragungsfunktion f, beschrieben mit 


Xt+1 = f(r, Ur, Zr) » (2.1) 


wobei x, der aktuelle Systemzustand, u, die Stell- oder Eingangsgröße und 
z der Zustand einer Störgröße ist. Im Zusammenhang mit vorausschauender 
Regelung ist die Störgröße des Systems häufig der Zustand einer Umgebungsva- 
riablen, die keine Zustandsgröße eines zu optimierenden Teilsystems ist, deren 
Verhalten aber für die Ableitung von Steuerungsaktionen relevant ist. Während 
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das zukünftige Verhalten des Systemzustands x, bei Kenntnis von u, und z, mit 
der Übertragungsfunktion f, ermittelt werden kann, ist für die Störgröße z; ein 
externes Vorhersagemodell notwendig. Im Folgenden wird daher die Störgröße 
z durch die für Vorhersagegrößen gebräuchliche Notation y; ersetzt. 


Das Regelungsziel wird bei MPC durch eine mathematische Zielfunktion Vr 
definiert. Bei begrenztem Zeithorizont T (Vorhersage- bzw. Optimierungshori- 
zont) wird die Zielfunktion definiert als 


T-1 
Vr = Je(ar,yr)+ YS Js (xru, ye) (2.2) 
t=0 


mit der Schrittgüte J, und den Terminierungskosten Jy. Mit der Zielfunktion Vr 
wird das Optimalsteuerungsproblem definiert, wobei die Entscheidungsvariable 
dabei in den meisten Fällen eine Folge von Stellgrößen ist. Das Optimalsteue- 
rungsproblem definiert sich hier wie folgt: 


V*= min Vr (2.3a) 

uo:T-1 
u. d. N.: x; = fs -1, 4-1, 1-1) > Vt (2.3b) 
u, € U € x Vt. (2.3c) 


U und X sind dabei die jeweiligen zulässigen Wertemengen für die Steuergröße 
u und den Systemzustand x. Die zu dem optimalen Wert V* der Zielfunktion ge- 
hörige Steuerfolge wird im Folgenden als ug.7_; = fat, Br ur} bezeichnet 
?, Die optimale Steuerfolge u* ergibt sich entsprechend mit 


u" =ug.p_] = arg min Vy. (2.4) 
uo:T-1 


Während das Optimalsteuerungsproblem somit über einen Zeithorizont T de- 
finiert ist, wird meist nur der erste Wert der resultierenden Steuerfolge un 
zur Steuerung des Systems verwendet (One-Step MPC) (siehe Abb. 2.2). Im 
nachfolgenden Zeitschritt wird das Optimalsteuerungsproblem mit einem dann 
um einen Zeitschritt verschobenen Optimierungshorizont erneut gelöst. Durch 


? Sequenzen und Folgen werden zur einfacheren Lesbarkeit mit der Notation x gekennzeichnet. 
Wird die Folge mit einem konkreten Indexbereich angegeben, wird die Index-Notation xı; mit 
xır = {x1,...,xr} verwendet. 
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Abb. 2.1: Vorhersage der Umgebungsgröße f, berechnete optimale Steuerfolge u* und der daraus 
resultierende Verlauf des Systemzustands x. 


die fortlaufende Lösung des Optimalsteuerungsproblems in jedem Zeitschritt 
entsteht dann eine Rückkopplung des Systemzustandes. Häufig wird daher 
auch der Begriff Receding Horizon Control verwendet. 


Wie in Gl. (2.3) ersichtlich ist, wird für die Lösung des Optimalsteuerungs- 
problems die Umgebungsgröße y über den Optimierungshorizont T benötigt. 
Da diese im Allgemeinen nicht bekannt ist, muss sie durch eine Schätzung 
bzw. Vorhersage ĵ ersetzt werden. Im Sinne der Begriffsdefinition aus Kapitel 
1, ist die Vorhersage y ein charakteristisches Element der vorausschauenden 
Regelung. 


Geeignete Lösungsverfahren für das Optimalsteuerungsproblem sind dabei von 
zahlreichen Eigenschaften des Systems bzw. Optimierungsproblems abhän- 
gig und werden daher im Zusammenhang mit der Anwendung in Kapitel 4 
thematisiert. 


Stochastische Optimalsteuerung 


Soll die Unsicherheit der Vorhersage in der Optimalsteuerung berücksichtigt 
werden, kann das Optimierungsproblem auch mit einer Verteilungsvorhersage 
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minE[V7] 


A Ur 
Xt | 


Abb. 2.2: Schematische Darstellung von One-Step-MPC mit Systemzustand x, € X und System- 
übertragungsfunktion fs, Optimalsteuerungsproblem min E[Vr], Umgebungszustand y; und dessen 
Vorhersage ¥;47 sowie berechneter Stellgröße u, € U und daraus folgender Systemzustand x; 1. 


Xt+1 > 


Y formuliert werden. Da im allgemeinen Fall der Systemzustand x abhängig 
von der Umgebungsvariablen y ist, stellt sich dann auch der Systemzustand im 
Optimalsteuerungsproblem als Verteilung X dar >. 


Da die Umgebungsgröße (und ggf. der Systemzustand) nur mit einer gewissen 
Unsicherheit vorhergesagt werden kann, muss die Zielfunktion durch ein sta- 
tistisches Maß ersetzt werden. Für das stochastische Problem ist es üblich die 
Zielfunktion Vr aus Gl. (2.2) durch ihren Erwartungswert E [Vr] zu ersetzen 
mit 


T-1 
3 [Vr] = E [J4 (Xr, fr)] + $ E [Js (X, u, ®,)] . (2.5) 
t=0 


Das stochastische Optimalsteuerungsproblem ist somit im Allgemeinen durch 


V* = min E [V7] (2.6) 


3 Der Systemzustand x ist durch den Einfluss der unsicheren Vorhersage 7 zwar ein Schätzwert, 
hängt aber bei Vernachlässigung der Unsicherheit der Systemübertragungsfunktion determinis- 


ace 


tisch von der Vorhersage Y ab. Daher wird die Verteilung X hier ohne ‚;“ notiert. 
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definiert. Eine auf diesem Optimalsteuerungsproblem basierende Regelung 
wird auch stochastisch modellprädiktive Regelung (SMPC) genannt. Ein Über- 
blick über das Themengebiet SMPC findet sich unter anderem in (May14) und 
(Mes16). 


Im Gegensatz zum deterministischen Optimalsteuerungsproblem kann eine 
Steuerfolge u als Optimierungsvariable unzureichend für das stochastische 
Problem sein. Um die Optimalität der Regelung zu gewährleisten, muss die 
Optimierungsvariable vielmehr ein Regelgesetz (z.B. eine Abfolge von zeitdis- 
kretisierten Regelgesetzen {vo(-),Vı(-),...,Vr(-)} sein. Dieser Fakt wird aus 
praktischen Gesichtspunkten jedoch häufig außer Acht gelassen. (May 14) 


Im Sonderfall linearer Systeme mit additivem weißem Rauschen als Stör- bzw. 
Umgebungsgröße und quadratischer Schrittgüten Js, ist die Lösung des deter- 
ministischen Problems bei Verwendung des Erwartungswerts der Vorhersage 
identisch mit der Lösung des stochastischen Problems. Diese Eigenschaft wird 
als certainty equivalence property bezeichnet (vW81). 


2.3 Grundlagen und Prinzipien von 
Vorhersagen 


Vorhersagen (auch Prognose oder Prädiktion) sind ausgiebiger Forschungsge- 
genstand im Bereich der Statistik, den Anwendungsgebieten Finanzwirtschaft 
und Ökonomie (siehe z.B. (TW00, GN14)) sowie der Meteorologie (siehe z.B. 
(FRG* 11, ZBW*13)). Allgemeine Grundlagen zu Vorhersagen finden sich un- 
ter anderem in (Arm01), (Die07) und (BD16). Vorhersagen spielen auch eine 
wichtige Rolle im Umfeld des autonomen Fahrens, beispielsweise in der Vor- 
hersage der Bewegung von Objekten (CLS* 15). Im Folgenden wird ein kurzer 
Überblick über die Grundlagen und Prinzipien von Vorhersagen gegeben. 


2.3.1 Klassifizierung von Vorhersagen 


Auf oberster Ebene lassen sich Vorhersagen zunächst in zwei Kategorien auftei- 
len: Qualitative und quantitative Vorhersagen. Im technischen Zusammenhang 
sind vor allem quantitative Vorhersagen von Interesse, welche daher weiter 
beleuchtet werden. Bei den Methoden der quantitativen Vorhersagen lassen 
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sich erklärende Modelle und Zeitreihen unterscheiden (Hyn11). Zeitreihen 
nutzen ausschließlich die Information der vorherzusagenden Variablen selbst, 
um Muster und Zusammenhänge im zeitlichen Verhalten der Variablen zu 
identifizieren. Sei y, der Zustand der Variablen zum Zeitpunkt r, dann lässt sich 
eine Zeitreihen-Vorhersage in einer Form 


r1 = f (Yt, Yt—-1:Yt-2;-- ) (2.7) 


schreiben (siehe Abb. 2.3). Beispiele für eine Zeitreihenmodellierung sind 
ARIMA-Modelle (Autoregressive Integrated Moving Average) oder exponenti- 
elle Glättung (GH06). 


Vorhersagemodell 


fC) 


Ist-Verlauf Vorhersage 


| 


Abb. 2.3: Prinzip-Darstellung einer Vorhersage mittels Zeitreihenmodellierung der Variablen y. 


Erklärende Modelle hingegen nutzen einen Zusammenhang zu anderen Infor- 
mationen (Einfluss- oder Prädiktorvariablen) um Aussagen über das zukünftige 
Verhalten der vorherzusagenden Größe zu treffen. Sehr häufig wird eine Kom- 
bination beider Kategorien angewendet, also z.B. in einer Form 


Siri = feinen) (2.8) 
mit der Prädiktorvariablen e (siehe Abb. 2.4). 


Werden Prädiktorvariablen verwendet, deren Zustände auch in der Zukunft 
bekannt sind, kann das erklärende Modell auch diese Informationen für eine 
Vorhersage miteinbeziehen (siehe Abb. 2.5). Beispiele für solche Prädiktorva- 
riablen können z.B. Umgebungsbedingungen sein, die sich aus Kartendaten 
ableiten lassen und dann auch im Voraus bekannt sind. 
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Prädiktor- 
variable 


Ist- Verlauf Vorhersage 
| 


Abb. 2.4: Prinzip-Darstellung einer Vorhersage y mittels eines erklärenden Modells und einer 
Prädiktorvariablen e. 


Es ist offensichtlich, dass Vorhersagen zwangsläufig mit Unsicherheit verbun- 
den sind. Gerade bei quantitativen Vorhersagen stellt sich häufig die Frage 
nach der Wahrscheinlichkeitsverteilung für die zu vorhersagende Größe, um 
diese Unsicherheit bewerten zu können. Quantitative Vorhersagen lassen sich 
daher weiter nach Punktvorhersagen (Vorhersage eines konkreten Wertes ¥;+1), 
Intervallvorhersagen (Vorhersage eines Intervalls, z.B. y;+1 + oy) und Vertei- 
lungsvorhersagen (Vorhersage der konkreten Verteilung, z.B. durch eine Nor- 
malverteilungsfunktion) unterscheiden (Hyn11). Die Vorteile von Verteilungs- 
gegenüber Punktvorhersagen sind eng mit der Problemstellung der Bewertung 
von Vorhersagen verbunden und werden daher im nächsten Abschnitt diskutiert. 


2.3.2 Bewertung von Vorhersagen 


Im Zusammenhang mit der Unsicherheit einer Vorhersage stellt sich unmit- 
telbar die Frage nach der Güte einer Vorhersage bzw. nach der optimalen 
Vorhersage. Entgegen der häufigen Annahme, dass der bedingte Mittelwert 
der tatsächlichen Verteilung die beste Vorhersage ist, lässt sich zeigen, dass 
die optimale Punktvorhersage bei gegebener Wahrscheinlichkeitsverteilung 
immer abhängig von der angelegten Bewertungsfunktion ist (vgl. (TWOO)). 
Diese Aussage ist besonders brisant, da häufig angelegte Gütemaße wie der 


15 


2 Grundlagen vorausschauender Steuerung und Regelung 


> 
Prädiktor- ý 
variable 
FU) 
Ist-Verlauf y Vorhersage 
b- - 


Abb. 2.5: Prinzip-Darstellung einer Vorhersage y mittels eines erklärenden Modells und einer auch 
im Voraus verfügbaren Prädiktorvariablen e (Vorausschaudaten). 


mittlere absolute Fehler (MAE), mittlere relative Fehler (MRE) oder mittlere 
absolute Prozentfehler (MAPE) systematische Vorhersagefehler favorisieren 
können. GNEITING (Gnell) zeigt dies beispielhaft in einer simulativen Studie. 


Ebenfalls erläutert wird diese Problematik in (EMW09): Die Autoren weisen 
hier darauf hin, dass häufig nach der besten Vorhersage gefragt wird, ohne 
dabei die angelegte Bewertungsfunktion zu nennen. Was die beste Vorhersage 
zu der subjektiven Verteilung des Vorhersagenden ist (z.B. Mittelwert, Median 
oder Modalwert), hängt dabei jedoch von eben dieser Bewertungsfunktion ab. 


Eine Schlussfolgerung dieser Abhängigkeit von optimaler Punktvorhersage 
und Bewertungs- bzw. Verlustfunktion ist, dass unterschiedliche Interessen 
von Nutzern einer Vorhersage den Einsatz von Verteilungsvorhersagen erfor- 
dern (TW00). Adressiert eine Vorhersage unterschiedliche Nutzer, kann eine 
Punktvorhersage nicht die gewünschte Information für alle Nutzer liefern. Es 
wurde in der Literatur daher schon vielfach argumentiert, dass Vorhersagen 
im Allgemeinen in der Form von Verteilungsvorhersagen erfolgen sollten (vgl. 
(DGT98, Gne08, GW13)). 


Diese Argumentation lässt sich direkt auf das Optimalsteuerungsproblem über- 
tragen, da die Abhängigkeit von Verlustfunktion und optimaler Vorhersage sich 
auf die Lösung des Optimalsteuerungsproblems auswirkt. Schließlich ist die 
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2.4 Positionierung der Arbeit 


Zielfunktion des Optimalsteuerungsproblems nichts anderes als die angeleg- 
te Bewertungsfunktion eines Anwenders der Vorhersage (in diesem Fall die 
Optimalsteuerung). D.h.: Der Einsatz einer Punktvorhersage in einem Optimal- 
steuerungsproblem fiihrt selbst bei idealer Vorhersage mit dem Mittel- oder 
Erwartungswert der Verteilung nicht zwangsläufig zur tatsächlichen Optimie- 
rung der Zielfunktion bezogen auf die unsicherheitsbehaftete Realisierung der 
System- und Umgebungszustinde. Da die Zielfunktion systemabhiangig ist, 
lässt sich weiter ableiten, dass bei gleichzeitiger Adressierung mehrerer Syste- 
me (mehrere Anwender der Vorhersage) nur durch eine Verteilungsvorhersage 
die geforderte Information transportiert wird. Die Berücksichtigung der Unsi- 
cherheit über eine stochastische Formulierung der Vorhersage und eine daraus 
folgende stochastische Formulierung des Optimalsteuerungsproblems ist aus 
mathematischer Sicht somit unerlässlich für die zuverlässige vorausschauende 
Steuerung von Systemen. 


2.4 Positionierung der Arbeit 


Zahlreiche Arbeiten haben sich der vorausschauenden Steuerung diverser Fahr- 
zeugsysteme gewidmet. Der Fokus der bekannten Arbeiten liegt dabei meist 
auf der Modellierung des Systems und dem Potentialnachweis einer voraus- 
schauenden Regelung. Tabelle 2.1 zeigt eine Übersicht von Arbeiten zur vor- 
ausschauenden Regelung von Fahrzeugsystemen. 


In der Mehrzahl der Fälle, wird MPC zur vorausschauenden Regelung einge- 
setzt, was im Regelfall eine Vorhersage von Umgebungs- oder Eingangsgrößen 
des Systems erfordert. Klassifiziert man die Arbeiten nach den verwendeten 
Vorhersagemodellen (siehe Tabelle 2.2), lassen sich zwei Aspekte feststellen. 


In einigen Fällen, wird die Aufgabenstellung der Vorhersage überhaupt nicht be- 
handelt und außer Acht gelassen (Annahme einer perfekten Vorhersage). Dies 
mag ein zulässiger Schritt sein, um zunächst das grundsätzliche Potential einer 
vorausschauenden Regelung zu erörtern. Aus der Perspektive der Anwend- 
barkeit ist diese Vernachlässigung jedoch im Allgemeinen unzulässig. In den 
Arbeiten, die keine Unsicherheiten im Regelungsverfahren selbst betrachten, 
finden sich auch zahlreiche Beispiele für Zeitreihenmodelle oder erklärende 
Vorhersagemodelle, die auf Strecken- und Verkehrsdaten oder andere externe 
Datenquellen zugreifen. 


2 Grundlagen vorausschauender Steuerung und Regelung 


Tabelle 2.1: Literaturüberblick vorausschauende Steuerung von Fahrzeugsystemen 


Energie- Thermo- Elektrofahrzeuge mit | Sonstige 
management von management” Dual-Energiequelle 

Hybridfahrzeugen” 

(AG09, Bac05, (AEJ17, Auel5, (GA17, GTKD17, (Koh13, RSA14, 
BMF10, BRD* 10, AWWK15, Goß09, SHL* 15, ZXS17) VSP06) 

CB11, Cas13, GS12) 


DLK* 13, DBBK14, 
GLP08, JAE07, 
KF09, LYY™ 16, 
MSDS12, PDCC13, 
Maal5, MFCS11, 
RBD* 10, Wah15, 
Wil09, ZW15, ZV12) 


* Teilweise auch unter Einbezug des thermischen Verhaltens von Antriebsstrang und Batterie. 
** Sowohl des Verbrennungsmotor, als auch des elektrischen Antriebsstrangs oder der Batterie. 


Im Falle einer stochastischen Betrachtungsweise (Berücksichtigung der Unsi- 
cherheiten im Regelungsverfahren) werden ausschließlich Zeitreihenmodelle 
(häufig Markov-Ketten) für die Vorhersage eingesetzt. 


Die Literaturübersicht zeigt, dass der Zusammenhang von Vorhersage und 
Optimalsteuerung im Kontext der vorausschauenden Steuerung von Fahrzeug- 
systemen bisher nur oberflächlich betrachtet wurde. In vielen Arbeiten aus der 
Literatur wird die Unsicherheit als Einflussgröße außer Acht gelassen. Wie in 
Abschnitt 2.3 erläutert, darf dies aber gerade bei Verwendung von Optimalsteue- 
rungsverfahren (Optimierung einer Bewertungsfunktion) nicht vernachlässigt 
werden. In den Arbeiten, die stochastische Verfahren zur Regelung einsetzen, 
werden verfügbare Daten (wie z.B. Streckendaten) nicht berücksichtigt und aus- 
schließliche Zeitreihenmodelle zur Vorhersage verwendet, die keinerlei externe 
Informationen in die Vorhersage miteinbeziehen. Dies erscheint wiederum eine 
unnötiger Verzicht auf Informationsgehalt in den Vorhersagen zu sein. 


Da die Vorhersage von Fahrzeugdynamikgrößen eine Voraussetzung für viele 
Anwendungen ist, soll in dieser Arbeit eine systematische Behandlung dieses 
Themas stattfinden. Dabei sollen Unsicherheiten in der Vorhersage und Rege- 
lung explizit betrachtet und berücksichtigt werden. Im Gegensatz zur Literatur 
soll bei der Generierung der Vorhersagen dabei jedoch auf die verfügbaren 
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2.4 Positionierung der Arbeit 


Tabelle 2.2: Klassifizierung von Arbeiten nach Vorhersagemethode und Beriicksichtigung von 
Unsicherheiten 


Unsicherheit beriicksichtigt in MPC? 


nein 


ja (SMPC) 


Perfekte Vorhersage (be- 
kannte Zukunft) 


(AEJ17, Auel5, AWWK15, 
GA17, NHSS11) 


Zeitreihenmodell 


(DLK*+ 13, GA17, VSP06, 
ZV 12, ZXS17) * 


(BMF10, BRD* 10, 
DBBK14, JAE07, KF09, 
LYY~* 16, MFCS11, 
RBD* 10, ZW15) 


Streckendaten, Verkehrsda- 
ten, etc. 


(AG09, Bac05, CB11, 
Cas13, GLP08, RSA14, 


Vorhersagemodell 


Wah15, ZV12) 


* In dieser Klassifizierung wird auch die Annahme, dass die Vorhersagevariable konstant bleibt, 
als Zeitreihenmodell eingeordnet. 


Streckeninformationen zurückgegriffen werden. Basierend auf dem Vorhersa- 
gemodell soll anschließend eine vorausschauende Steuerung unterschiedlicher 
Fahrzeugsysteme aufgebaut werden. Um die unterschiedlichen Aspekte im 
Zusammenspiel zwischen Vorhersage und Optimalsteuerung zu untersuchen, 
sollen dabei reale Messfahrten mit unterschiedlichen Fahrern angewendet wer- 
den und die Auswirkungen von verschiedenen Vorhersagemethoden verglichen 
werden. 
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3 Vorhersage der 
Fahrzeugdynamik 


Für zahlreiche Anwendungen im Umfeld der Steuerung von Fahrzeugsystemen 
sind fahrdynamische Größen relevant. Die Fahrzeugdynamik umfasst dabei 
kinetische wie kinematische Größen der Fahrzeugbewegung. Unter Vorhersage 
der Fahrzeugdynamik wird die Vorhersage der im Folgenden beschriebenen 
Fahrzeugdynamikgrößen verstanden. 


3.1 Relevante Größen der Fahrzeugdynamik 


Nachdem im vorherigen Kapitel die Grundlagen von Vorhersagen im Allgemei- 
nen thematisiert wurden, wird in diesem Abschnitt das spezifische Problem der 
Vorhersage der relevanten Fahrzeugdynamikgrößen behandelt. Diese bestehen 
zunächst aus den Bewegungsgrößen des Fahrzeugs: Fahrgeschwindigkeit v, 
Längsbeschleunigung a, und Querbeschleunigung a,. In vielen Anwendungs- 
fällen ist auch die benötigte Antriebsleistung von Interesse. Da Antriebstopo- 
logie und Systemzustände des Antriebs (z.B. Gangwahl) sowie weitere Ein- 
flussgrößen die vom Antrieb zu erbringende Leistung beeinflussen, verwendet 
man als Leistungsgröße meist die über die angetriebenen Räder abzugebende 
Radleistung Pr (vgl. (KF09, BRD* 10, RBD* 10, MFCS11, DBBK14)). 


Unter Vernachlässigung von Fahrbahnquerneigung und Seitenwind, resultiert 
die Querbeschleunigung des Fahrzeugs ausschließlich aus den Seitenführungs- 
kräften des Fahrzeugs. Unter der Voraussetzung, dass die maximal möglichen 
Kräfte der Reifen dabei nicht überschritten werten, gilt für die Aufbauquerbe- 
schleunigung dabei 


a= =v. (3.1) 
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3 Vorhersage der Fahrzeugdynamik 


mit der Fahrzeuggeschwindigkeit v und dem Bahnradius r bzw. der Bahnkrüm- 
mung K der Bewegung. Geht man vereinfacht davon aus, dass der Fahrer der 
Fahrspurmitte folgt, ist die Bahnkrümmung identisch mit der Straßenkrüm- 
mung. In diesem Fall ergibt sich die Querbeschleunigung somit direkt aus der 
Fahrzeuggeschwindigkeit und dem Straßenverlauf. 


Unter Annahme bekannter Geschwindigkeit und Wunschbeschleunigung a; 
des Fahrzeugs, berechnet sich die Radleistung Pr bei Vernachlässigung der 
Leistung durch Antriebs- oder Bremsschlupf sowie Schräglaufwiderstand aus 
dem Fahrwiderstand Fw mit 


PrR=Fw:v=(FR+Fs+FRr+Fp)'v, (3.2) 


wobei sich Fw aus den Einzelkräften des Luftwiderstands Fz, des Steigungswi- 
derstands Fs, des Radwiderstands Fr und des Beschleunigungswiderstands Fg 
zusammensetzt. 


Dabei berechnet sich der Luftwiderstand Fy, zu 
1 2 
F= PL“ CW “Avy, (3.3) 


mit der Luftdichte pz, dem Luftwiderstandsbeiwert cw, der Fahrzeugfrontfläche 
A und der Fahrzeuggeschwindigkeit v. 


Der Steigungswiderstands Fs ergibt sich mit der Fahrzeugmasse m, der Gravi- 
tationskonstante g und dem Steigungswinkel & zu 


Fy =m-g-sing. (3.4) 


Der Radwiderstand kann mit dem Radwiderstandsbeiwert fr vereinfacht zu 
FR = fr: m: g-cosa (3.5) 
berechnet werden. 


Der Beschleunigungswiderstand ergibt sich direkt aus der Längsbeschleuni- 
gung a, zu 
Fg =m ax, (3.6) 
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3.2 Literaturiiberblick Fahrermodellierung 


wobei m’ die Fahrzeugmasse mit Berücksichtigung der rotatorischen Massean- 
teile darstellt. 


In Summe ergibt sich die Radleistung als eine Funktion von Fahrzeugparame- 
tern, der Fahrgeschwindigkeit, der Beschleunigung und der Fahrbahnsteigung: 


Pg = Fw -v = f(va,,0)'v. (3.7) 


Die Radleistung kann während der Fahrt nicht direkt gemessen werden. Unter 
der Annahme, dass der Modellfehler zur Berechnung der Radleistung vernach- 
lässigbar klein gegenüber Unsicherheiten einer Vorhersage ist, kann aber die 
Modellgröße der Radleistung nach Gl. (3.7) als Schätzung verwendet werden. 


Die Radleistung Pr und Querbeschleunigung a, ergeben sich somit als abhän- 
gige Größen von Geschwindigkeit v und Längsbeschleunigung a,. Vorhersage 
von Geschwindigkeit bzw. Längsbeschleunigung ist folglich die zentrale Her- 
ausforderung in der Vorhersage der Fahrzeugdynamik. 


Zur einfacheren Notation wird unter der Vorhersagevariablen y im Folgenden 
der Vektor der besagten Fahrzeugdynamikgrößen verstanden: 


y= [v,ax,ay, Prl” s (3.8) 


3.2 Literaturüberblick Fahrermodellierung 


3.2.1 Grundlagen der Fahrermodellierung 


Die Vorhersage der Fahrzeugdynamik y ist untrennbar mit dem Fahrerverhalten 
verbunden. Das Thema Fahrerverhalten und -modellierung wird für zahlreiche 
Anwendungsgebiete aus unterschiedlichen Betrachtungsperspektiven behandelt. 
Im Folgenden werden die Modellierungsaspekte thematisiert, die aus Sicht einer 
Fahrzeugdynamikvorhersage notwendig sind. Weiterhin werden mathematische 


4 Bei der Regelung des Fahrzeugs (z.B. Fahrerassistenzsystem) sind die hier bezeichneten Größen 
üblicherweise Systemzustände. Da in dieser Arbeit aber die Steuerung von Fahrzeugsystemen 
betrachtet wird und die Steuerung des Fahrzeugs dem Fahrer obliegt, handelt es sich aus 
Perspektive eines Fahrzeugsystems bei y im Allgemeinen um eine Umgebungsgröße bzw. 
Randbedingung. 
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3 Vorhersage der Fahrzeugdynamik 


Fahrermodelle, die im Zusammenhang mit Vorhersagen verwendet werden, 
analysiert. Ein Literaturüberblick zu Fahrermodellen mit unterschiedlichen 
Schwerpunkten findet sich unter anderem in (Ran94, Mac03, PEO7, WH12, 
WXC14, KP15). 


Hierarchisches Modell der Fahraufgabe 


Ein sehr häufig referenziertes Modell zur Darstellung der Fahraufgabe ist 
das hierarchische 3-Ebenen-Modell (vgl. (Mic84)). Dieses Handlungs-Modell 
besteht aus drei Ebenen: Strategie-, Manöver- und Steuerungs-Ebene. 


Die strategische Ebene beschreibt die generelle Planungsebene einer Fahrt. Sie 
umfasst die eigentliche Ziel- und Routenplanung. Die Manöver-Ebene (auch 
taktische Ebene genannt) umfasst die Manöverplanung, also z.B. Spurwahl und 
-wechsel, Überholvorgänge und tolerierter Abstand zu anderen Fahrzeugen. 
Die daraus resultierende grobe Bahn- und Trajektorienplanung wird auf dieser 
Ebene gesteuert. Auf der untersten Ebene (Steuerungsebene) werden schließlich 
die eigentlichen Steuerhandlungen (Fahrpedal, Bremse, Lenkradwinkel, etc.) 
zur Erreichung der übergeordneten Ziele koordiniert. 


Zeitkonstante 


Strategieebene min 


Umgebungs- 
informationen 


Umgebungs- 
‘ i — ms 
informationen 


Abb. 3.1: Darstellung der Fahraufgabe nach (Mic84). 


Manöverebene S 
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3.2 Literaturiiberblick Fahrermodellierung 


Die Vorhersage der Fahrzeugdynamik y = [v, dx, Ay, Pr)’ lässt sich im Wesentli- 
chen der Manöverebene zuordnen, da die resultierende Geschwindigkeit und 
Beschleunigungen maßgeblich durch die grobe Bahn- und Trajektorienplanung 
dominiert wird. Regeltätigkeiten auf der Steuerungsebene wie Betätigung der 
Bremse und des Lenkrads üben zwar auch einen Einfluss auf die resultierende 
Fahrzeugdynamik aus, jedoch in geringerem Maße wie die Bahn- und Tra- 
jektorienplanung durch die Manöverebene. Die Strategieebene beeinflusst die 
resultierende Fahrzeugdynamik nur indirekt durch die übergeordnete Wahl der 
Route bzw. des Fahrtziels. 


Fahrercharakterisierung und -klassifizierung 


Während sich das zuvor geschilderte hierarchische Modell mit der prinzipiellen 
Darstellung der Fahraufgabe und involvierten Handlungsebenen widmet, wird 
häufig auch die Charakterisierung und Klassifizierung von unterschiedlichen 
Fahrertypen diskutiert. 


Taubman-Ben-Ari et al. (TBAMG04) verweisen auf folgende, häufig unter- 
schiedenen Fahrertypen: 


= rücksichtslos und leichtsinnig 
= ängstlich 

= aggressiv und feindselig 

= geduldig und vorsichtig 


Diese psychologisch orientierte Klassifizierung wird vor allem im Zusammen- 
hang mit Untersuchungen zur Sicherheit und Unfallprävention verwendet (siehe 
z.B. (TBAMG04)). Eine andere häufig eingesetzte Klassifizierung orientiert 
sich eher an fahrdynamischen Merkmalen (vgl. (Ebe06, BZKHK11, WLI1, 
DGG14)). In solchen fahrdynamischen Klassifizierungen kommen meist fol- 
gende Fahrertypen in unterschiedlichen Abstufungen vor: 


= sportlich 
= normal 
= entspannt 


Als Merkmale der Fahrertypen werden dabei im Wesentlichen die gewünschte 
bzw. tolerierte Längs- und Querdynamik verwendet. 
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3 Vorhersage der Fahrzeugdynamik 


Da es keine allgemein akzeptierte Definition und Interpretation von Fahrstilen 
und dementsprechenden Klassifizierungen gibt, werden auch zahlreiche andere 
Fahrerklassifizierungen eingesetzt (z.B. im Zusammenhang mit Folgefahrt 
und Abstandsregelverhalten). In gleicher Weise existieren ebenso zahlreiche 
Methoden zur Ermittlung des Fahrstils aus Messdaten. Siehe hierzu (BNKZ11, 
DGG14, VLZ14, MG15). 


Akzeptierte Querdynamik: Die Untersuchungen der Zusammenhänge zwi- 
schen Fahrzeugdynamikmerkmalen und dem Fahrertyp bzw. Fahrerverhalten 
wird in der Literatur schon seit geraumer Zeit thematisiert. Der Zusammenhang 
zwischen akzeptierter Querdynamik und Fahrgeschwindigkeit bzw. Fahrertyp 
wird z.B. in (Sch82, KD83, Man85, Sch85, Fuc93, vG96, Ham99, RKDBO1, 
NH03, BZKHK11) diskutiert. Übereinstimmend wird meist ein allgemeiner 
Zusammenhang zwischen der akzeptierten Querbeschleunigung und dem indi- 
viduellen Fahrstil berichtet. Weitere Abhängigkeiten oder typische Grenzwerte 
werden unterschiedlich wiedergegeben. Dies ist nicht zuletzt auf die teilweise 
sehr unterschiedlichen Zeiträume der Untersuchungen (Baujahr der Fahrzeuge) 
und die Rahmenbedingungen (Art der Fahrzeuge, Versuchsdurchführung, Ver- 
suchsumgebung oder Testpersonen) zurückzuführen. Meist bleiben jedoch auch 
andere Einflussfaktoren, wie z.B. Verordnungen und Bemessungsgrundlagen 
im Straßenwesen und damit einhergehende Randbedingungen, unberücksich- 
tigt. Ein interessante Kenngröße, die in einigen Arbeiten thematisiert wird 
((GMB84, vG96, RKDBO1)) ist die time to line crossing (TLC). Die TLC 
beschreibt die zeitliche Sicherheitsreserve, die dem Fahrer bleibt, um auf ei- 
nen Fehler im Lenkwinkel zu reagieren, ohne die Fahrbahnbegrenzungen zu 
überschreiten. Die TLC beschreibt damit zum einen den Zusammenhang der 
Geschwindigkeit über den Kurvenradius. Dabei ergibt sich für eine konstante 
TLC ein annähernd konstanter Zusammenhang zwischen Fahrgeschwindigkeit° 
und akzeptierter Querbeschleunigung (RKDBO1). Zum anderen beschreibt 
eine konstante TLC auch die Abhängigkeit der akzeptierten Geschwindigkeit 
bzw. Querbeschleunigung von der Breite der Straße und den Fähigkeiten des 
Fahrers. Sowohl bei geringerer Straßenbreite, als auch bei einer schlechteren 
Fähigkeit des Fahrers den Lenkwinkel zu schätzen und einzustellen, muss 
die Geschwindigkeit verringert werden, um eine konstante zeitliche Sicher- 
heitsreserve im Sinne einer TLC beizubehalten. Nickel und Hugemann haben 


5 Ausgenommen davon sind sehr geringe Geschwindigkeiten. 
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3.2 Literaturiiberblick Fahrermodellierung 


eine Studie mit unterschiedlichen Versuchsfahrern durchgeführt und die Längs- 
und Querbeschleunigungen im Alltagsverkehr aufgezeichnet (NHO3). Der von 
ihnen berichtete Zusammenhang zwischen akzeptierter Querbeschleunigung 
und Kurvenradius zeigt eine ähnliche Charakteristik wie der Verlauf fiir eine 
konstante TLC. 


Längsdynamik: Weitere Untersuchungen zeigen, dass sich Fahrer in ihrem 
Beschleunigungs- und Verzögerungsverhalten unterscheiden, wobei die Höhe 
der absoluten Beschleunigung charakteristisch für den Fahrstil ist (siehe z.B. 
(Fuc93, BZKHK11)). Zusätzlich zur Fahrerabhängigkeit, zeigen Untersuchun- 
gen weitere Abhängigkeiten wie z.B. von der zu überbrückenden Geschwindig- 
keitsdifferenz (KD83) oder dem Fahrzeugtyp (Fuc93). Ebenso zeigt sich eine 
generelle Abhängigkeit von der Geschwindigkeit, da die für die Beschleuni- 
gung benötigte Leistung mit der Geschwindigkeit ansteigt (BZKHK11). 


Diese Abhängigkeiten stellen eine Herausforderung für die Abbildung von Fah- 
rerverhalten dar. Dabei sind verschiedene Aspekte zu beachten. Ein komplexes 
Modell ermöglicht viele Freiheitsgrade in der Abbildungsfähigkeit, erschwert 
aber die Adaption und Identifikation der jeweiligen fahrerindividuellen Para- 
meter im Fahrbetrieb. Eine größere Anzahl von berücksichtigten Parametern 
erlaubt so eine flexible Anpassung des Modells an gemessene Daten. Diese 
Flexibilität führt aber zu Einbußen in der Validität des Modells als Prädik- 
tor (WH12). Winter et al. (WH12) weisen daher darauf hin, dass komplexere 
Fahrermodelle für Vorhersagemodelle nicht zielführend sind. Die tatsächlich 
gemessenen fahrdynamischen Größen sind das Resultat des Zusammenwirkens 
von äußeren Faktoren und den internen Handlungsprozessen des Fahrers auf 
der Manöver- und Steuerungsebene. Darüber hinaus ist zu berücksichtigen, 
dass der Fahrer kein technisches Regelsystem ist und die Regelgrößen nur mit 
einer gewissen Genauigkeit über kombinierte Sinneseindrücke ermitteln kann 
(Mac03). 


3.2.2 Vorhersagemodelle 


Im vorhergehenden Abschnitt wurden die allgemeinen Modellierungsaspekte 
fiir Fahrerverhalten thematisiert. In diesem Abschnitt werden in der Literatur 
eingesetzte Modelle zur Vorhersage von Fahrerverhalten oder resultierenden 
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3 Vorhersage der Fahrzeugdynamik 


Größen, wie der Fahrzeugdynamik behandelt. Dabei lassen sich vor allem 
Zeitreihen- und streckenbezogene Modelle unterscheiden. 


Zeitreihen und zeitreihen-ähnliche Modelle 


Zeitreihenmodelle sind Vorhersagemodelle der Form 


firi = FVn,9-1,J1-23---) (3.9) 
(siehe hierzu auch Abschnitt 2.3.1). 


Wie bereits in Abschnitt 2.1.2 erwähnt, werden sehr häufig Markov-Ketten als 
Zeitreihenmodelle für Fahrzeugdynamikgrößen verwendet. Markov-Ketten sind 
ein stochastisches Prozessmodell mit einem diskreten, endlichen Zustandsraum 
S= {1,...,m}. Der zeitabhängige Zustand S; der Markov-Kette wird dabei 
als Zufallsvariable modelliert mit $; € S. Der nächste Zustand der Kette wird 
über die Matrix M der Übergangswahrscheinlichkeiten P(S,;|S;) definiert. 
Die Übergangsmatrix M beschreibt damit die Wahrscheinlichkeiten der Zu- 
standswechsel über die bedingten Übergangswahrscheinlichkeiten P($,+1|$r) 
mit: 


P(S =1|S=1) « P(S =m|S, = 1) 
We u -G10 
P(S = 1S; =m) +++ P(S = mS; =m) 


Zur einfacheren Darstellung wird die Wahrscheinlichkeit P(S;41 = j|S; = i) im 
Folgenden als p;; bezeichnet. Abb. 3.2(a) veranschaulicht die Übergangsmög- 
lichkeiten einer Markov-Kette mit drei Zuständen, Abb. 3.2(b) die mögliche 
Entwicklung des Zustands S$; über der Zeit. 


In (DBBK14) wird z.B. eine Anwendung der Markov-Ketten zur Radleistungs- 
vorhersage vorgestellt. Hierfür wird der auftretende Bereich der Radleistung in 
m Abschnitte entsprechend m Markov-Zuständen aufgeteilt. Die Übergangs- 
wahrscheinlichkeiten M werden aus Fahrzyklen ermittelt. Mithilfe des aktuellen 
Zustands S; und der Ubergangsmatrix M kann eine stochastische Vorhersage 
für die auftretende Radleistung berechnet werden. Vorteil der Markov-Ketten 
ist die relativ einfache Anwendbarkeit und der diskrete Zustandsraum, der sich 
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Pil P22 P33 


P31 i | > 


(a) (b) 


Abb. 3.2: Markov-Kette mit drei Zuständen und den Übergangswahrscheinlichkeiten p; j in sta- 
tionärer Darstellung (a) und Darstellung der zeitabhängigen Entwicklung vom Zustand $; = 2 


(b). 


gut fiir eine numerische Weiterverarbeitung eignet. Offensichtlich ist die Vor- 
hersage aber stark abhängig von den Trainingsdaten des Modells. Diese Form 
der Vorhersagen eignen sich daher vor allem zur Abbildung charakteristischer 
Eigenschaften eines typischen Fahrprofils, wie z.B. des täglichen Arbeitswegs. 
Ändern sich die Umgebungsbedingungen, also beispielsweise in Form eines 
nicht in den Trainingsdaten enthaltenen Streckenprofils, ist mit einer Abnahme 
der Vorhersagegüte zu rechnen. 


Neben reinen Zeitreihenmodellen finden sich im automobilen Kontext häufig 
Mischformen des Typs 


Pena = Un Yt1; t Ct @r-1) ++) (3.11) 


(siehe auch Abb. 2.4). Im Zusammenhang mit Folgefahrt-Verhalten werden 
beispielsweise PWARX® eingesetzt (ASHIO8). Die Idee hinter dem Einsatz 
solcher Modelle ist, dass sich das Verhalten durch die Kombination mehre- 
rer einfacher (z.B. linearer) Modelle abbilden lässt. Solche Modelle werden 


6 piecewise affıne autoregressive models with exogenous input 
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haufig fiir Abbildung von Fahrerverhalten auf der Regelungsebene verwendet. 
In (ASHIO8) wird ein solches Modell zur Vorhersage der Pedalansteuerung 
(Brems- und Fahrpedal-Stellung) eingesetzt. Als Eingangsgrößen dienen dabei 
der Abstand zum Vorderfahrzeug sowie dessen Zeitableitung. In (AMT12) 
wird ein Vergleich der Prädiktionsgüte zwischen einem PWARX-basiertem 
Ansatz (ähnlich des Modells in (ASHIO8)) und einem auf Gaussian Mixture 
Models (GMM) basierenden Ansatz für die Pedalansteuerung in Folgefahrt 
durchgeführt. Die GMM-Variante bildet ein Wahrscheinlichkeitsmodell der 
Vorhersagegröße abhängig von den Eingangsgrößen ab. Dabei wird die Wahr- 
scheinlichkeitsdichte für die nächste Pedalansteuerung über GMM abgebildet. 
Die Vorhersagegüte von GMM- und PWARX-basiertem Ansatz erweist sich 
nach (AMTI2) als vergleichbar. Der ausgewertete Vorhersagehorizont liegt 
dabei zwischen einer und vier Sekunden. 


Im Unterschied zu den Markov-Ketten, die auf eine Abbildung der charakteris- 
tischen Muster der Fahrzeugdynamikgrößen abhängig von Fahrer und Strecke 
abzielen, steht bei diesen Arbeiten die Abbildung menschlichen Regelverhal- 
tens im Fokus (Regelungs-Ebene im hierarchischen Modell, siehe Abschnitt 
3.2.1). Da außer den aktuellen Randbedingungen keine weiteren Informatio- 
nen berücksichtigt werden, eignen sich solche Vorhersagemodelle nur für sehr 
kurze Zeithorizonte innerhalb des aktuellen Manövers. 


Ein interessanter Ansatz zur Fahrsituationsvorhersage über ein Manöver hin- 
aus findet sich in (TNH™ 15). Hierbei wird eine sprach-ähnliche Struktur zur 
Modellierung von Fahrverhalten und Fahrsituationen eingesetzt (als double 
articulation analyzer bezeichnet). Buchstaben repräsentieren dabei eine tat- 
sächliche physikalische Messgröße, wie z.B. der Bremspedalweg oder Lenk- 
radwinkel. Wörter repräsentieren situative Zustände, wie „rechts Abbiegen“ 
oder „geradeaus Fahren“. Durch Lernen einer Sprachlogik bzw. Grammatik 
(ähnlich des Satzbaus in der Sprache) kann dieses Modell zur Vorhersage 
der wahrscheinlichsten nächsten Situation eingesetzt werden. Der Ansatz von 
(TNH*15) verknüpft somit die Identifikation von Manövern mit logischen 
Manöverfolgen. 
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Streckenbezogene Modelle 


Die bisher angefiihrten Verfahren modellieren die Vorhersage basierend auf 
dem vergangenen Verhalten der Vorhersagegröße selbst und dem vergangenen 
Verhalten anderer zusätzlicher Eingangsvariablen. Der Vorteil ist somit die uni- 
verselle Einsetzbarkeit der Modelle, da keine externen Informationen benötigt 
werden. Dazu abgrenzen lassen sich Verfahren, die Streckeninformationen zur 
Vorhersage nutzen. Diese Art von Vorhersagen können als ein erklärendes Mo- 
dell verstanden werden, das Informationen über zukünftige Randbedingungen 
verwendet (siehe auch Abb. 2.5). Diese Verfahren lassen sich nach der Art 
der Informationsbeschaffung in historien- und kartendatenbasierte Modelle 
unterscheiden. 


Eine historienbasierte Vorhersagemethode für die Geschwindigkeit wird in 
(Maull) vorgestellt. Grundlage des Verfahrens ist die Aufzeichnung von Ge- 
schwindigkeiten verknüpft mit GPS-Koordinaten. An den Stützstellen der 
GPS-Koordinaten wird mittels Kerndichteschätzung eine Verteilung der auftre- 
tenden Geschwindigkeiten ermittelt. Vorteil des Verfahrens ist die prinzipielle 
Berücksichtigung der auftretenden Streuung an einer Koordinate. Dem gegen- 
über steht der große Speicherbedarf bei lokaler Verarbeitung im Fahrzeug und 
die prinzipbedingte Abhängigkeit von bereits gefahrenen Strecken, um eine 
Geschwindigkeitsvorausschau bereitstellen zu können. Durch die mittlerweile 
vorhandene Konnektivität der Fahrzeuge kann die lokale Ermittlung der Ge- 
schwindigkeiten durch eine flottengestützte Geschwindigkeitsverteilung aus 
hochaufgelösten Verkehrsdaten ersetzt werden. Bei bekanntem Ziel lassen sich 
mit Verkehrsdaten Prognosen der Geschwindigkeit über einen langen Zeithori- 
zont erstellen. Die Nutzung der Verkehrsdaten zur Geschwindigkeitsvorhersage 
wird z.B. in (GLP08, Wah15) behandelt. Bei ausreichender Abdeckung durch 
den Verkehrsdatenprovider können solche Verfahren ohne die Notwendig- 
keit von Trainingsdaten eingesetzt werden. Verkehrsdaten lassen sich nur zur 
Vorhersage der Geschwindigkeit jedoch nur schwer für die übrigen Vorhersage- 
größen der Fahrzeugdynamik (z.B. Querbeschleunigung a, und Radleistung 
Pr) einsetzen. Des Weiteren eignen sich Verkehrsdaten nur für die Bereitstel- 
lung gemittelter Größen über viele Verkehrsteilnehmer und ermöglichen keine 
situative oder fahrerindividuelle Adaption. 


Kartendatenbasierte Vorhersagen nutzen sog. prädiktive Streckendaten als 
Informationsquelle. Prädiktive Streckendaten werden vom Navigationssystem 
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bereitgestellt und enthalten neben geometrischen Informationen des Straßen- 
verlaufs (Krümmung und Steigung) auch Informationen wie beispielsweise 
gesetzliche Geschwindigkeitsbeschränkungen. Eine genauere Beschreibung der 
prädiktiven Streckendaten findet sich in Abschnitt 3.3. In (MRP04), (THP* 10) 
und (FHFG16) finden sich Ansätze zur Geschwindigkeitsvorhersage mit Stre- 
ckendaten. In allen der drei Arbeiten wird die Längsdynamik des Fahrers 
parametriert um Geschwindigkeitsübergänge zwischen Geschwindigkeitslimits 
zu berechnen. Die resultierende Vorhersage ist ein kontinuierlicher Geschwin- 
digkeitsverlauf. In (THP*10) und (FHFG16) wird zusätzlich die aus dem Ge- 
schwindigkeitsverlauf resultierende Radleistung mittels eines Fahrzeugmodells 
ermittelt. Eine Untersuchung und Bewertung der Vorhersagegüte der Modelle 
findet in beiden Fällen nicht statt. 


Cassebaum (Cas13) vergleicht das vorausschauende Energiemanagement eines 
Hybridfahrzeugs unter Verwendung eines historienbasierten und eines strecken- 
datenbasierten Modells. Bei dem streckendatenbasierten Ansatz wird ähnlich 
wie in (MRPO4) und (THP*10) die Längsdynamik des Fahrers parametriert. 
Zusätzlich erfolgt eine Berücksichtigung von Geschwindigkeitsverringerungen 
durch die Kurvigkeit der Strecke. Es ist zu beachten, dass die Parametrierung 
des Fahrers bei der späteren Anwendung der Vorhersage als bereits bekannt 
betrachtet wird. Für den historienbasierten Ansatz werden mehrere Messfahr- 
ten auf der gleichen Strecke durchgeführt. Aus dieser Trajektorienmenge wird 
mittels unterschiedlicher Verfahren (z.B. arithmetischer und geometrischer 
Mittelwert) eine positionsgestützte Geschwindigkeitsprognose abgeleitet. Die 
aufgezeichneten Messdaten zeigen eine deutliche Streuung der Geschwindig- 
keiten über unterschiedliche Fahrten. Die resultierende Energiemanagement- 
strategie unter Verwendung beider Prädiktionsansätze wird jeweils mit dem 
Resultat bei Idealprädiktion (Geschwindigkeitsprofil ist bekannt) verglichen. 
Cassebaum erzielt mit beiden Ansätzen vergleichbare Ergebnisse (Cas13). Im 
Mittel werden 0,8% bzw. 1% Verbrauchseinsparung erzielt. Zu beachten ist die 
deutliche Differenz zur Verbrauchseinsparung bei idealer Vorhersage (3%). In 
manchen Szenarien (Stadtfahrten) kommt es auch zu einer Verschlechterung 
des Verbrauchs durch den Einsatz der vorausschauenden Strategie. Dieses Bei- 
spiel verdeutlicht die Notwendigkeit der Betrachtung von Unsicherheiten bzw. 
Fehlern einer Vorhersage beim Einsatz von vorausschauenden Regelungsver- 
fahren. 
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Fazit 


Streckenbezogene Vorhersagen werden vor allem fiir die Fahrgeschwindigkeit 
verwendet. Dabei werden historienbasierte Ansätze sowie Verkehrsdaten und 
prädiktive Streckendaten eingesetzt. Während die Vorhersagen mit Verkehrsda- 
ten vor allem auf mittleren Verkehrsgeschwindigkeiten beruhen, werden bei den 
bekannten Ansätzen mit prädiktiven Streckendaten auf Trajektorienmodellen 
basierende Vorhersagen verwendet. Verkehrsdaten können dabei für Prognosen 
mit langem Zeithorizont eingesetzt werden, während die Trajektorienmodelle 
sich eher für einen kürzeren Zeithorizont eignen. 


Werden die Vorhersagen ohne Informationen über die voraus liegende Stre- 
cke berechnet, kommen vor allem für die Regelungsebene der Fahraufgabe 
parametrische und nicht-parameterische Vorhersagemodelle zum Einsatz (kur- 
ze Vorhersage-Zeithorizonte). Anwendungsgebiete sind dabei vor allem im 
Bereich von Folgefahrt- und Abstandsregelverhalten zu finden. Auf einem 
längeren Zeithorizont werden hauptsächlich stochastische Modellierungen mit 
Markov-Ketten für Vorhersagen fahrdynamischer Größen eingesetzt. Diese 
Form der Modellierung eignet sich dabei zur Abbildung genereller Fahrer- 
Strecke-Charakteristika, bildet aber keine situationsspezifischen Informationen 
ab. 


Grundsätzlich verspricht die Verwendung prädiktiver Streckendaten eine hohe 
Validität der Vorhersagen für die relevanten Fahrzeugdynamikgrößen. Dabei 
wurde in den bisherigen Ansätzen dieser Kategorie die Unsicherheit von sol- 
chen Vorhersagen vernachlässigt. Ebenso befassen sich nur wenige Arbeiten 
mit der generellen Bewertung und Validierung der Vorhersagemodelle. Dass 
die Vernachlässigung von Unsicherheiten von Vorhersagen vor allem im Zu- 
sammenhang mit Optimalsteuerungsverfahren kritisch zu sehen ist, ist in der 
Literatur bekannt und wurde in Abschnitt 2.3 erläutert. Da die Vorhersage 
der Fahrzeugdynamik eine der zentralen Herausforderungen für neue Anwen- 
dungen im Bereich der vorausschauenden Regelung von Fahrzeugsystemen 
darstellt, soll die fahrerindividuelle und situationsspezifische Vorhersage der 
Fahrzeugdynamik unter Berücksichtigung von Unsicherheiten in den folgenden 
Abschnitten systematisch hergeleitet werden. 
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3.3 Pradiktive Streckendaten 


Prädiktive Streckendaten (PSD) werden vor allem fiir advanced driver assis- 
tance systems (ADAS) eingesetzt und vom Navigationsgerät bereitgestellt. Die 
Daten werden dabei mittels eines Ubertragungsprotokolls (z.B. ADASIS-v2 
(RBB*08)) über den Fahrzeug-Kommunikationsbus versendet. Mittels der im 
Protokoll übertragenen Daten wird in Fahrtrichtung des Fahrzeugs ein elektro- 
nischer Horizont (EH) als Baumstruktur der vorausliegenden Streckensegmente 
aufgebaut. Dieser wird zyklisch aktualisiert und enthält unter anderem Attribute 
für Straßenklassen, Geschwindigkeitsbeschränkungen, Kurvenkriimmungen, 
Abbiegewinkel, Steigungen und Kreuzungsinformationen. Wenn keine Zielfüh- 
rung aktiv ist, orientiert sich der Aufbau des EH am wahrscheinlichsten Pfad 
(MPP - engl.: Most Probable Path), der vom Navigationsgerät typischerwei- 
se anhand statischer Regeln ermittelt wird. Ein beispielhafter elektronischer 
Horizont ist in Abb. 3.3 dargestellt. 
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Abb. 3.3: Elektronischer Horizont der vorausliegenden Strecke. Die Segmente sind baumartig von 
der Position des Fahrzeugs aufgebaut und nummeriert (Positionsangaben relativ zum Startpunkt 
des Wurzelsegments - hier Nr. 15). 


Der elektronische Horizont enthält somit sowohl eine geometrische Beschrei- 
bung der vorausliegenden Straße als auch zusätzliche Informationen wie ge- 
setzliche Beschränkungen. Der EH hat typischerweise eine Länge von einigen 
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hundert bis wenigen tausend Metern, abhängig von der Verzweigtheit des 
Straßennetzes und dem Straßenverlauf. 


3.4 Teststrecke und Messfahrten 


Zur Untersuchung von Vorhersagemodellen und Verfahren zur vorausschauen- 
den Steuerung wird ein Testset an Messfahrten benötigt. Da unterschiedliches 
Fahrerverhalten ein relevanter Faktor für die Fahrzeugdynamik ist, sollen diese 
Testdaten aus Aufzeichnungen mit unterschiedlichen Fahrern bestehen. Ebenso 
soll die verwendete Teststrecke charakteristische Elemente für fahrdynamisches 
relevantes Verhalten enthalten. 


Die Teststrecke im Raum Stuttgart wurde so gewählt, dass sie sowohl kurvige 
Landstraßen, Ortschaften als auch Autobahnanteile enthält (siehe Abb. 3.4). 
Die Gesamtlänge der Strecke beläuft sich auf ca. 37.5 km. Die Teststrecke 


Start/Ziel 
Weissach 


N 
= 


Rutesheim 
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Abb. 3.4: Gewählte Strecke für die Testfahrten. Start und Ziel jeweils am Entwicklungszentrum 
Weissach. Zu Beginn bestehend aus einer Überlandstrecke mit einigen Ortsdurchfahrten und einem 
Abschnitt auf der Autobahn A8 gegen Ende der Strecke. ©OpenStreetMaps 


wurde mit neun unterschiedlichen Fahrern aufzeichnet. Es wurden dabei keine 
Instruktionen bezüglich des Fahrverhaltens gegeben. Für die Durchführung der 
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Messfahrten standen ein Porsche 911 Carrera 4S und ein Porsche Panamera Tur- 
bo zur Verfiigung (Fahrzeugdaten siehe Tabelle 3.1). Drei der Fahrten wurden 
mit dem 911 Carrera 4S und sechs mit dem Panamera Turbo durchgefiihrt. Da 
die Fahrzeuge ein ähnliches Leistungsgewicht besitzen, sind nur geringe durch 
das Fahrzeug verursachten Unterschiede im längsdynamischen Fahrerverhalten 
zu erwarten. 


Tabelle 3.1: Technische Daten der verwendeten Testfahrzeuge. 


Porsche 911 Carrera 4S Porsche Panamera 
Cabrio Turbo 
Leistung 294 kW (400 PS) 382 kW (520 PS) 
Leergewicht” 1.555 kg - 1.635 kg 1.970 kg - 2.175 kg 
* nach DIN 70020. 


Abb. 3.5 zeigt die Geschwindigkeitsverläufe der Fahrten. Weitere Abbildungen 
zu den aufgezeichneten Fahrten finden sich in Anhang A.1. 


L___]Überland L___] Stadt [____] Autobahn 


Abb. 3.5: Geschwindigkeit v tiber der Fahrtstrecke s fiir die aufgezeichneten Testfahrten. 
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3.5 Stochastisches Framework zur 
Fahrzeugdynamikvorhersage 


Vorhersagen auf Basis von Streckendaten erfordern ein Trajektorienmodell, das 
den Zusammenhang zwischen den Streckendaten und den gesuchten Fahrzeug- 
dynamikgrößen beschreibt. Während klassische zeitreihenbasierte Vorhersage- 
modelle (z.B. Markov-Ketten) durchgängig stochastisch formuliert sind, hat 
diese Unsicherheitsmodellierung bei der Verwendung von Streckendaten bisher 
wenig Beachtung gefunden und es wird ein deterministischer Zusammenhang 
vorausgesetzt. Dies ist aus mehreren Gründen problematisch. 


Zum einen setzt ein deterministischer Zusammenhang deterministisches Ver- 
halten (im Parameterraum des Trajektorienmodells) und somit meist auch eine 
Zeitinvarianz des Fahrerverhaltens voraus. Die Suche nach der richtigen Para- 
metrierung des Trajektorienmodells und dem konkreten Parametersatz eines 
Fahrers wird somit zu einer sehr komplexen, wenn nicht unlösbaren Aufgabe. 
Dies kann als einer der Gründe für die von Winter und Happee (WH12) er- 
wähnte typische Überparametrierung von Fahrermodellen im Zusammenhang 
mit Vorhersagen vermutet werden. Passt das vorgeschlagene Modell mit seinen 
adaptierten Parametern nicht zum beobachteten Verhalten des Fahrers, müssen 
zusätzliche Parameter hinzugefügt werden, um eine weitere Anpassung des 
Modells zu ermöglichen. 


Zum anderen vernachlässigt die deterministische Formulierung eine Betrach- 
tung von Unsicherheiten in der Vorhersage. So kann keine Kommunikation von 
beobachteten Unsicherheiten oder uneindeutigen Situationen erfolgen (Bsp.: 
Kreuzungen und Abbiegemöglichkeiten oder das Verhalten anderer Verkehrs- 
teilnehmer). Der Nutzer der Vorhersage, in diesem Fall eine vorausschauende 
Regelung bzw. Optimalsteuerung, wird so in falscher Sicherheit gewogen und 
kann nicht angemessen auf die Situation reagieren. Die Frage ist somit, wie 
eine streckendatenbasierte Trajektorienvorhersage unter Berücksichtigung von 
Unsicherheiten erreicht werden kann. 


Eine Möglichkeit hierfür ist die stochastische Formulierung im Parameter- 
raum der Übertragungsfunktion (vgl. (FHFG17)). Solche Verfahrensweisen 
werden z.B. in der Manövervorhersage für die Risiko- und Situationsbewer- 
tung im Zusammenhang intelligenter Fahrzeuge eingesetzt (vgl. (LVL14)). Die 
zwei Grundbestandteile einer solchen Formulierung sind eine Träger- oder 
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Transferfunktion, die den grundsätzlichen Zusammenhang zwischen den Vor- 
hersagegrößen und den Eingangsdaten parametriert und eine stochastische 
Modellierung im Parameterraum der Funktion, die wiederum unterschiedliche 
Verhaltensweisen innerhalb der Formulierung der Transferfunktion berücksich- 
tigt. Eine solche Modellierung soll in diesem Abschnitt für die Vorhersage der 
Fahrzeugdynamik mit Streckendaten erarbeitet werden. 


Abb. 3.6 zeigt diese Form der Vorhersage in einer schematischen Darstellung. 
Dabei sind folgende Arbeitsschritte notwendig: 


(1) Ableitung geeigneter Beobachtungsgrößen (V, siehe Gleichung 3.26) 
aus dem Ist-Verlauf der Vorhersagegrößen (y, siehe Gleichung 3.8). 

(2) Inferenz der Prozessparameter (0, siehe Gleichung 3.27) des 
stochastischen Modells (T`), die das Verhalten beschreiben. 

(3) Ableitung zukünftiger Parameterwerte (Y) der Transferfunktion, 
basierend auf dem stochastischen Modell. 

(4) Vorhersage (9) durch Übertragung der Parameterwerte 
in den Bildraum mit der Transferfunktion fr. 


In den nächsten Abschnitten werden zunächst die Modellierungsaspekte der 
Transferfunktion (5) und des stochastischen Modells (6) diskutiert. 


3.5.1 Transferfunktion 


Die Transferfunktion hat die Aufgabe, die grundlegenden Zusammenhänge 
zwischen den Streckendaten und der Fahrzeugdynamik zu beschreiben und zu 
parametrieren. 


Parametrierung der Geschwindigkeit: Die Höchstgeschwindigkeit ist bei un- 
beeinflusster Fahrt zunächst durch die gesetzliche Geschwindigkeitsbeschrän- 
kung vorgegeben. Studien zu Fahrerverhalten zeigen, dass Fahrer die Geschwin- 
digkeitsbeschränkung sowohl systematisch unter- als auch überschreiten (siehe 
z.B. (HA02, Roy03)). Diese Abweichung wird dabei von Umweltfaktoren wie 
der Straßenklasse, den Wetterbedingungen, Verkehrsfluss oder der sozialen 
Umgebung beeinflusst (Zai92). Grundsätzlich ist es also naheliegend die Ziel- 
geschwindigkeit über das Geschwindigkeitslimit und eine Abweichung hierzu 
zu beschreiben. Die Zielgeschwindigkeit vz wird somit über das Geschwin- 
digkeitslimit vj;,, und ein Geschwindigkeitsoffset va (positiv oder negativ) 
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Abb. 3.6: Prinzip-Darstellung der Vorhersage für y mit einer Prädiktorvariablen e und einem 
stochastischen Modell T'(0) für die Vorhersage der Prädiktorvariable sowie einer Transferfunktion 
zur Ermittlung der eigentlichen Vorhersagevariable y. 


Vorhersage 


beschrieben. Im Sonderfall eines unbeschränkten Streckenabschnitts ist diese 
relative Parametrierung nicht möglich. Daher wird für unbeschränkte Strecken 
die Freifahrgeschwindigkeit vmax als zusätzlicher Parameter definiert. Damit ist 
die Zielgeschwindigkeit vz durch 


wo Vmax, falls Aviim (3.12) 
í Vlim + VA, falls Aim , 


definiert, wobei v/;,, die aktuell gültige Geschwindigkeitsbeschränkung ist. 


Parametrierung des dynamischen Verhaltens: Neben der Geschwindigkeit 
bei unbeeinflusster Fahrt ist eine Parametrierung für das dynamische Verhalten 
notwendig. Dazu zählen zum einen Übergänge zwischen Geschwindigkeitsbe- 
schränkungen und zum anderen Einschränkungen durch Kurven und Abbiegun- 
gen. Die vielfältigen Abhängigkeiten des dynamischen Verhaltens (siehe Ab- 
schnitt 3.2.1) stellen eine Herausforderung für die Parametrierung dar. Gemäß 
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der Argumentation von WINTER UND HAPPEE (WH12) ist für Vorhersagen 
von Fahrerverhalten eine einfache Parametrierung anzustreben, da komplexe 
Modelle häufig eine schlechtere Eignung als Prädiktor aufweisen. Desweiteren 
ist zu berücksichtigen, dass nicht alle Größen, denen in der Literatur ein Einfluss 
zugesprochen wird, auch in den aktuellen Kartendaten verfügbar sind (z.B. Stra- 
Renbreite). Vereinfachend wird daher von konstanten Längsbeschleunigungs- 
und Längsverzögerungsgrenzen dy max UNd Ay min ausgegangen. Ebenso wird 
für das Querdynamikverhalten zunächst eine geometrie- und geschwindig- 
keitsunabhängige maximal tolerierte Querbeschleunigung dy max angenommen. 
Zusätzlich wird für die Längsbeschleunigung eine Radleistungsgrenze Pax 
definiert, um die Ausnutzung der vorhandenen Motorleistung durch den Fahrer 
zu parametrieren. 


Um stetige Beschleunigungsverläufe und ruckfreie Geschwindigkeitsverläufe 
zu gewährleisten, wird die Änderungsrate der Beschleunigung (der Ruck) auf 
einen maximal zulässigen Betrag jmax begrenzt (vgl. (FHFG17)). 


Zuletzt wird zur vollständigen Parametrierung der Transferfunktion noch das 
Zielsegment szp hinzugefügt, das die Route auf dem aktuellen Segmentbaum 
Tpsp definiert. Der Parametervektor y der Transferfunktion ist damit durch 


: T 
y= [va, Vmax, x, max, Ax,min, ay max, Pmax, Jmax; sıp] (3.13) 


gegeben. Der zulässige Geschwindigkeitsraum wird durch die Zielgeschwin- 
digkeit (va und Vmax) sowie die maximal tolerierte Querbeschleunigung a, max 
beschränkt. Die Geschwindigkeitsbeschränkung einer gekriimmten Strecke 
ergibt sich bei Annahme spurmittiger Fahrt zu 


VKurve = YAy,max ` Y (3.14) 


mit Kurvenradius r. Die längsdynamischen Parameter (ax max, Ax,min» Jmax> Pmax) 
beeinflussen das Ubergangsverhalten zwischen den einzelnen Geschwindig- 
keitsbeschränkungen. 


Die Berechnung der Bewegungstrajektorie des Fahrzeugs und damit der Fahr- 
zeugdynamik y erfolgt zeitdiskret. Die Transferfunktion fr kann mit dem 
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aktuellen Zustand der Fahrzeugdynamik y; und der Fahrzeugposition s; damit 
als nichtlineare Funktion 


Vt+1 


dx t+1 
yai = | | = fr Onst Y, Tesp) (3.15) 


ay t+1 


PRit+i 


geschrieben werden. Zur Integration der Bewegungsgrößen wird über einen 
Zeitschritt mit abschnittsweise konstantem Ruck’ und damit linearem Beschleu- 
nigungsverlauf gerechnet. Sei a, ;+1 die zulässige Beschleunigung des nächsten 
Zeitschritts, dann gilt für die neue Fahrzeugposition: 


axt (x 

5141 = 8; + vAr + ( = + F )Ar?. (3.16) 
Die zeitdiskrete Auswertung der Transferfunktion fr ist in Abschnitt A.2 
genauer beschrieben. 


Abb. 3.7 zeigt beispielhafte Verläufe der Vorhersagegröße y für zwei unter- 
schiedliche Zielsegmente aus Abb. 3.3 mit den zugehörigen Parametervektoren 


yı = [Om/s, 36.11m/s, 3m/s?, —3m/s?,4m/s?, Pi kW, 1.5m/s° , 26] T 


sowie % = yı mit Ausnahme des Zielsegments: Zielsegment syp = 43 (Auto- 
bahn) für %, im Gegensatz zu s;p = 26 (Landstraße) bei y. 8 EN bezeich- 
net hierbei die Radleistung, die für die Beschleunigung a, (in m/s?) bei 100 
km/h benötigt wird. In Abb. 3.8 sind Verläufe der Vorhersagegröße für unter- 
schiedlich Parametrierungen von y visualisiert (Werte entsprechend Tab. 3.2 in 
Abschnitt 3.6.2). 


7 Zeitableitung der Beschleunigung. 

8 Mit festgelegten Parametern y der Transferfunktion (Trajektorienmodell), kann für jede Position 
aus Kurvenkrümmungen und gesetzl. Geschwindigkeitslimitierungen eine obere Beschränkung 
für die Fahrzeuggeschwindigkeit ermittelt werden. Der Verlauf der Fahrzeuggeschwindigkeit 
kann dann unter Einhaltung der vorgegebenen Ruckbeschränkungen von diesen oberen Be- 
schränkungen ausgehend errechnet werden. 
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Abb. 3.7: Beispielhafte Trajektorien (Geschwindigkeit v, Längsbeschleunigung ay, Querbeschleu- 
nigung a, und Radleistung Pr) für unterschiedliche Zielsegmente der Situation aus Abb. 3.3 
(Parametervektoren yı (blau) und % (rot)). 
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Abb. 3.8: Beispielhafte Trajektorien (Geschwindigkeit v, Längsbeschleunigung ax, Querbeschleuni- 
gung ay und Radleistung Pr) für die Autobahnroute aus Abb. 3.3 mit unterschiedlich parametrierter 
Fahrerwunschdynamik. Graue Flächen markieren Einschränkungen durch Geschwindigkeitslimits 
oder Kurven. 
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3.5.2 Stochastische Prozessmodellierung 


Der zweite Bestandteil des Vorhersagemodells nach der Transferfunktion ist 
die Modellierung eines stochastischen Prozesses im Parameterraum der Trans- 
ferfunktion, der die Unsicherheiten und Einflüsse berücksichtigt. Für die sto- 
chastische Modellierung müssen also die Einflüsse und deren Unsicherheiten 
analysiert und geeignete stochastische Beschreibungen hergeleitet werden. 


Route 


Für die Vorhersage muss zunächst das Fahrtziel, also die ID des Zielsegments 
sıp auf dem aktuellen Segmentbaum bekannt sein. Für den Fall einer aktiven 
Routenführung durch das Navigationssystem ist dieses Zielsegment bekannt. 
In allen anderen Fällen muss das Zielsegment geschätzt werden und ist folg- 
lich mit einer Unsicherheit verbunden. Dies kann über die Zuweisung von 
Wahrscheinlichkeiten für die einzelnen Routenoptionen erfolgen. 


Prinzipiell können zwei Verfahrensweisen zur Ermittlung der Routenwahr- 
scheinlichkeiten unterschieden werden. Die Segmentwahrscheinlichkeiten kön- 
nen als A-Posteriori-Wahrscheinlichkeiten abgeleitet werden. In diesem Fall 
würden die Wahrscheinlichkeiten, ausgehend von möglichen „globalen“ Zielen 
- außerhalb des elektronischen Horizonts - ermittelt werden. Diese Ziele kön- 


H r2 H rz 


Abb. 3.9: Zuweisung der Segmentwahrscheinlichkeiten mittels A-Posteriori-Wahrscheinlichkeiten, 
ausgehend von möglichen Zielen außerhalb des elektronischen Horizonts. Die Wahrscheinlichkeit 
der Segmente an der Kreuzung ergeben sich aus den Wahrscheinlichkeiten der möglichen Ziele 
(Pz, ; Pz ‚Pz,) bzw. deren Pfadwahrscheinlichkeiten. 
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nen zum Beispiel aus vergangenen Fahrten des Fahrers abgeleitet werden. Die 
Ermittlung möglicher Ziele bzw. Routen ist Gegenstand zahlreicher Arbeiten 
(siehe z.B. (CLY*11, FK08, KB03, LJEL12, SBS06)). 


Davon unterscheiden lässt sich die Zuweisung von A-Priori-Wahrscheinlich- 
keiten für die Segmente. In diesem Fall werden die Wahrscheinlichkeiten ohne 
Vorkenntnisse aus dem Segmentbaum abgeleitet. Da die Routenermittlung und 
-identifikation nicht im Fokus dieser Arbeit liegt, wird folgend ein a priori 
Verfahren zur Festlegung der Segmentwahrscheinlichkeiten beschrieben und 
im Weiteren verwendet. 


Abb. 3.10: Zuweisung der Segmentwahrscheinlichkeiten mittels A-Priori-Wahrscheinlichkeiten, 
ausgehend von der Fahrzeugposition. Die Wahrscheinlichkeit der Segmente an der Kreuzung wird 
direkt bestimmt/vorgegeben. Die Wahrscheinlichkeiten für einzelne Pfade/Ziele ergeben sich aus 
der Kombination der Wahrscheinlichkeiten aller dazugehörigen Segmente. 


Zuweisung von Segmentwahrscheinlichkeiten: Bei unbekannter Route oder 
inaktiver Zielführung gilt: Sei {s;+1,...,si+n } die Menge aller vom Segment 
s; abzweigender Segmente, dann werden die Segmentwahrscheinlichkeiten ps; 
mit 


wj teak 
Ps; = ‚Weli+Li+N]|, 
“ Dein Wk 
E falls 5, € S 
1 k E OMPP (3.17) 

£2 falls &(s,) =0 

Wk = 21,21 
€+€: falls sk € SuppA a(s~) =0 
1 sonst 
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berechnet. Dabei ist Sypp die Menge aller Segmente des Most Probable Path 
(siehe Abschnitt 3.3) und o(s,) der Abbiegewinkel des Segments są. Dadurch 
werden die Gewichtungen von Segmenten des MPP bzw. von Segmenten ohne 
Abbiegewinkel um £; bzw. & erhöht. 


Bei bekannter Route oder aktiver Zielführung gilt (der MPP entspricht in 
diesem Fall der Route der Zielführung): 


Wj : A . 
Ps; = WeiitlitN], 
7 ye Wk | 
.1 
e falls sz € Sypp (ad) 
Wk = E 
0 sonst 


Im Folgenden wird der stochastische Prozess, der mögliche Zielsegmente s; 
entsprechend der Segmentwahrscheinlichkeit ps; zuweist, mit I’, bezeichnet. 


Zielgeschwindigkeit 


Wie im Abschnitt 3.5.1 erläutert, wird die Zielgeschwindigkeit durch das Ge- 
schwindigkeitsoffset va und die Maximalgeschwindigkeit vmax beschrieben. 
Diese Parameter bilden das Geschwindigkeitsverhalten ohne querdynamische 
Einschränkungen (Kurven und Abbiegungen) ab. Dieses Verhalten unterliegt 
dabei vielfältigen Einflüssen (vgl. (Zai92, HAO2)) und ist nicht als konstant 
anzunehmen (HA02). Es wird daher von einer Zufallsverteilung V, des Para- 
meters vq ausgegangen. Es ist dabei zu beachten, dass vz bzw. vı nicht direkt 
beobachtet werden kann (siehe hierzu auch Abschnitt 3.6). Dies ist darin be- 
gründet, dass die beobachtbare Geschwindigkeit v Produkt aller statischen 
und dynamischen Einschränkungen ist, wohingegen vz ein Parameter der zu- 
grundeliegenden Transferfunktion fr ist. Für das Geschwindigkeitsoffset und 
die Maximalgeschwindigkeit wird dabei eine Gaußverteilung VA = N (ua, o2) 
bzw. Vmax = N (Umax, C2ax) angenommen. Für vz gilt somit die kombinierte 
Verteilungsfunktion Vz mit 


Vm IX» fall im 
rene ie alls Bvtim (3.19) 
Viim +Va, sonst 
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Neben der absoluten Beschreibung Vz, wird eine Beschreibung fiir das zeit- 
liche Verhalten ohne Änderung der Geschwindigkeitsbeschränkung benötigt. 
Dieses zeitliche Verhalten kann als Drift bzw. zufälliges Schwanken der Ziel- 
geschwindigkeit beschrieben werden, verursacht z.B. durch das Blick- und 
Regelverhalten des Fahrers (ZW13) oder andere Störeinflüsse wie Verkehr 
oder veränderte Umgebungsbedingungen (Bebauung, Straßenbeschaffenheit, 
0.ä.). Abb. (3.11) zeigt beispielhafte Geschwindigkeitsverläufe bei Testfahrten 
unterschiedlicher Fahrer auf einem Landstraßen- (a) und einem Autobahnab- 
schnitt (b). In beiden Fällen ist das Geschwindigkeitslimit konstant und es sind 
keine relevanten Einschränkungen durch Kurven vorhanden. Die Kurvenein- 
schränkung wird durch die Begrenzung für |a,| < 2m/s? visualisiert, was der 
Querbeschleunigungsgrenze eines ruhigen Fahrers nach Hamberger (Ham99) 
entspricht. 


60 60 
= 49 2" 40 
= 5, 
> 20 > 20 
0 : 0 
0 1000 2000 0 500 1000 1500 2000 
s [m] s [m] 
(a) (b) 


Abb. 3.11: Beispielhafte Geschwindigkeitsverläufe v über Strecke s für einen Landstraßen- (a) und 
Autobahnausschnitt (b) aus den Testfahrten. Die graue Markierung zeigt Einschränkungen durch 
Kurven bei einer tollerierten Querbeschleunigung von 2 m/s?. 


Da für die Modellierung dieses Zeitverhaltens kein durchgängiges Erklärungs- 
modell möglich scheint, soll dieses Verhalten über eine Zeitreihenmodellierung 
beschrieben werden. Autoregressive Prozesse werden häufig zur Beschrei- 
bung von wert-kontinuierlichen Zeitreihen eingesetzt (vgl. (SS11, Mud14)) 
und kommen für diese Modellierung in Frage. 


Ein autoregressiver Prozess (AR) beschreibt eine Zeitreihe, bei der sich der 
aktuelle Wert der Zeitreihe aus einer Linearkombination der p vorhergehenden 
Werte und einem zufälligen Rauschterm zusammensetzt. Diese Prozesse sind 
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somit geeignet die zeitliche Korrelation einer Zeitreihe zu beschreiben. Ein 
autoregressiver Prozess von Ordnung p (AR(p)) ist dabei mit 


p 
y=c+8& +} o-y-i, (3.20) 
i=1 


durch die Kombination einer Konstanten c, eines Rauschterms €; und eines 
gewichteten, gleitenden Mittels der p vorhergehenden Werte der Zeitreihe 
definiert. Für den Rauschterm wird üblicherweise eine unabhängige, identische 
Gaußverteilung mit Erwartungswert null angenommen. Unter Vernachlässigung 
von Saisonalität wird im Folgenden der AR(1)-Prozess 


Y=c+&+6-y-1, E ~N (0,02) (3.21) 


betrachtet. Für c = 0 und den Grenzfall @ = 0 entspricht der Prozess wei- 
Bem Rauschen, während man für ¢ = 1 von einem Random Walk spricht. Für 
0 < @ < 1 beschreibt das Modell einen Zufallsprozess mit Korrelation aufein- 
anderfolgender Realisierungen und einer Gauß-verteilten Innovation &,. Der 
AR(1) Prozess ist stationär für |ġ| < 1 und hat den Erwartungswert 
c 
L(y) = . 3.22 
(y) 1-9 ( ) 
Abb. 3.12 zeigt Realisierungen eines AR(1)-Prozesses mit & & N (0,1) für 
unterschiedliche Werte von @. Für eine ausführliche Betrachtung von AR- 
Prozessen siehe z.B. (BJRL15, KWH13). 


AR(1) 


Abb. 3.12: Beispielhafte Realisierungen eines AR(1)-Prozesses y; mit einer Innovation & «N (0, 1) 
und AR-Koeffizient @ = 0.5 bzw. 0.95. 
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Wird folgend vorausgesetzt, dass das Niveau der Geschwindigkeit der Vertei- 
lung Vz und das Zeitverhalten einem AR(1)-Prozess folgt, kann der kombinierte 
Prozess der Zielgeschwindigkeit formuliert werden als 


vars = (1 — &)(Övarı-ı + &), & ~ N (0,02) 
Vu,t = 6,0 + (1 — &)Vu 1-1; a, ~ Vz 
Vz =Vut + VARs; (3.23) 
1 fall im lim t— 
&= | als Vrins E Viens una) 
0 sonst 


Dabei ist vjjm das zum Zeitpunkt t dominierende, also das Fahrerverhalten 
bestimmende Geschwindigkeitslimit und vz, die Zielgeschwindigkeit zum Zeit- 
punkt t. Die Zielgeschwindigkeit vz wird dabei aus dem Mittelwertsprozess 
Vu und dem autoregressiven Anteil vag, zusammengesetzt. Die Zielgeschwin- 
digkeit ist dabei eine Realisierung der Verteilung Vz, wenn sich das dominieren- 
de Geschwindigkeitslimit geändert hat. Bei gleichbleibendem dominierendem 
Geschwindigkeitslimit ist die Zielgeschwindigkeit die Realisierung eines auto- 
regressiven Prozesses. Eine ausführlichere Betrachtung der Prozessparameter 
dieses Modells erfolgt in Abschnitt 3.6. 


Der in Gleichung 3.23 beschriebene Prozess der Zielgeschwindigkeit wird im 
Folgenden mit I‘, bezeichnet. 


Fahrerwunschdynamik 


Die übrigen, in der Prozessmodellierung noch nicht diskutierten Parameter der 
Transferfunktion, beschreiben das dynamische Verhalten und lassen sich somit 
dem Begriff der Fahrerwunschdynamik bzw. Fahrstil zuordnen. Ähnlich wie 
bei der Zielgeschwindigkeit liegt auch hier das Problem der eingeschränkten 
Beobachtbarkeit vor: So sind Beschleunigungs- und Verzögerungsvorgänge 
weder scharf abgrenzbar, noch sind die hervorrufenden Einflüsse genau zu 
identifizieren. So kann z.B. der Beschleunigungsvorgang bei einer Änderung 
des Geschwindigkeitslimits durch andere Einschränkungen wie Verkehr oder 
Kurven beeinflusst sein. Ähnlich ist auch bei Kurvenfahrten nicht eindeutig 
identifizierbar, ob eine vorliegende Kurve eine relevante Einschränkung dar- 
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stellt und die beobachtete Querbeschleunigung somit als charakteristische 
Größe betrachtet werden kann. 


Neben der Unsicherheit durch die eingeschränkte Beobachtung sind auch an- 
dere Unsicherheiten zu berücksichtigen. So können sowohl Änderungen des 
Fahrerverhaltens durch Umgebungsfaktoren als auch durch Zeitabhängigkeiten 
auftreten. Neben diesen selbstgesteuerten Änderungen kann beispielsweise 
durch vorausfahrenden Verkehr eine erzwungene Änderung der Dynamik er- 
folgen. Dabei ist sowohl das Verhalten vorausfahrender Fahrzeuge, wie auch 
deren Existenz bzw. Relevanz über einen längeren Vorhersagehorizont ein 
Unsicherheitsfaktor. Diese Einflussfaktoren stellen eine Herausforderung für 
die Modellierung dar. 


Werden die oben genannten Parameter zum Beispiel unabhängig voneinander 
betrachtet, bedeutet das bei einem Wechsel in der Dynamik des Fahrers, dass 
zunächst auch alle Parameter getrennt beobachtet und adaptiert werden müssen, 
bevor das System sich an die geänderten Dynamikanforderungen angepasst hat. 
Dies kann für den Fahrer zu unplausiblen Systemreaktionen führen, da trotz 
dynamischer Beschleunigung von einer ruhigen Kurvenfahrt ausgegangen wird. 
Im Kontext mit Fahrzeugdynamikvorhersagen ist es daher sinnvoll von einem 
„monotonen“ Zusammenhang zwischen Fahrstil und Dynamik auszugehen, also 
Abstufungen von ruhiger bis dynamischer Fahrweise (siehe auch Abschnitt 
3.2.1). Dadurch wird eine Konsistenz des geschätzten Zustandes der Fahrer- 
wunschdynamik gewährleistet und die Möglichkeit der zügigen Adaption auf 
plötzliche Änderungen (z.B. durch aufkommenden Verkehr) geschaffen. Im Ge- 
genzug werden Freiheitsgrade in der Parametrierung der Fahrerwunschdynamik 
aufgegeben. 


Eine Möglichkeit die Schätzung von nicht direkt beobachtbaren Zuständen 
mit stochastischem Zeitverhalten zu verknüpfen, sind Hidden Markov Models 
(HMM). 


Ein Hidden Markov Model (HMM) besteht aus einer Markov-Kette, die nicht 
direkt beobachtbar ist und daher als versteckter Prozess bezeichnet wird. Ein 
zweiter Prozess, dessen Zustände mit den versteckten Zuständen der Markov- 
Kette in Verbindung stehen, ist beobachtbar und wird daher als Beobachtungs- 
prozess bezeichnet. Der Beobachtungsprozess besteht aus dem Vektor der 
Beobachtungsgrößen O;, die Zustände der Markov-Kette werden als S, bezeich- 
net. Der Beobachtungsprozess wird durch die Beobachtungswahrscheinlichkeit 
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P(O,|S;) definiert. Der Wert P(O,|S,) gibt an, mit welcher Wahrscheinlichkeit 
die Beobachtung O, gemacht wird, wenn die Markov-Kette im Zustand 5; ist. 


Das Zeitverhalten der Zustände des HMM wird über die Übergangsmatrix M 
der Markov-Kette beschrieben (siehe auch Gl. 3.10). 


P31 


Pu 


Abb. 3.13: Hidden Markov Model mit einer Markov-Kette $, mit drei Zuständen (s1, $2, s3) und 
deren Ubergangswahrscheinlichkeiten p; j, einer Beobachtungsgröße O, mit zwei Zuständen (01, 
02) sowie den Beobachtungswahrscheinlichkeiten P(o ;|s;) für die Beobachtung von O, = 0; bei 
Zustand $; = si. 


Die Zustände des HMM werden — wie in (FHFG17) - für mögliche Zustände 
der Fahrerwunschdynamik eingesetzt. Jedem Zustand i € S wird daher ein 
Tupel 7,,; mit 


a (3.24) 


Ydi = [dx,max,is ax mini, Ay,max,i> Prax,iy Jmax,i 


zugeordnet, das die dem Zustand zugeordneten Parameterwerte definiert. 
Die Menge aller möglichen Zustände wird mit S = {1,--- , Naum} bezeich- 
net. Die Markov-Kette definiert somit die Häufigkeit des Auftretens dieser 
Fahrerwunschdynamik-Zustände sowie deren Übergangswahrscheinlichkeiten. 


Die Modellierung der Beobachtungswahrscheinlichkeiten P(O,|S;) kann auf 
unterschiedliche Weise erfolgen. Für einen diskreten Wertebereich der Be- 
obachtungsgröße kann eine Matrix der Beobachtungswahrscheinlichkeiten 
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aufgestellt werden. Für einen kontinuierlichen Bereich wird P(O,|S;) häufig 
über Gaußverteilungen oder GMMs modelliert. Ist eine Beobachtungsreihe 
O1ı:r gegeben, kann durch das Beobachtungsmodell mittels Bayes’scher In- 
ferenz auf die Zustandswahrscheinlichkeiten P(S;) des versteckten Prozesses 
geschlossen werden. Ein geeignetes Beobachtungsmodell vorausgesetzt, kann 
das HMM somit zur Beobachtung und Vorhersage der Fahrerwunschdynamik 
verwendet werden. Die Herleitung eines geeigneten Beobachtungsmodells 
und die Bestimmung der Zustandswahrscheinlichkeiten wird in Abschnitt 3.6 
behandelt. 


Der Prozess, der das Zeitverhalten der Markov-Kette auf den Parametervektor 
[ax max, Ax,min, Ay, max Pax; Jna abbildet, wird als Fahrerwunschdynamikpro- 
zess I'„ bezeichnet. 


Das Prozessmodell 


In den vorhergehenden Abschnitten wurden zunächst die stochastischen Model- 
lierungsmöglichkeiten für die Parameter y diskutiert. Dabei wurden stochasti- 
sche Prozesse hergeleitet, die geeignet sind, das Verhalten und die Unsicherheit 
der unterschiedlichen Einflussgrößen zu beschreiben. Zusammenfassend wird 
der Prozess, der das stochastische Verhalten aller Parameter abbildet, mit T' 
bezeichnet. Es gilt somit: 

y~r. (3:25) 


Der Zeitdiskretisierung des Prozesses wird als Vielfaches der Zeitdiskreti- 
sierung At = 1 s definiert. Hierfür wird der Zeitschrittfaktor c; r eingeführt. 
Die Schrittweite des Prozesses sollte so gewählt werden, dass das Verhalten 
bzw. die Frequenz der Änderungen im Verhalten abgebildet werden können. 
Da die Parameter der Transferfunktion im wesentlichen Charakteristiken der 
Manöverebene des Fahrers beschreiben, wird im Folgenden eine eher große 
Zeitschrittweite von cz r At = 5 s für den stochastischen Prozess gewählt, um 
diese Charakteristiken geeignet zu erfassen. 
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3.6 Parameterinferenz 


Wihrend sich bei einer deterministischen Betrachtung die Fahreradaption als 
Schatzproblem der Parameter y darstellt, ist fiir die stochastische Modellierung 
das Schätzen der Prozessparameter von I’ notwendig. In diesem Abschnitt wird 
die Ermittlung dieser Prozessparameter behandelt. 


Der Zielgeschwindigkeitsprozess I, wird durch die aktuelle Zielgeschwindig- 
keit vz,,, die Parameter des autoregressiven Prozesses (@, Og) und die Para- 
meter der Verteilung Vz (UA, OA, Umax, Omax) definiert. Um die Parameter der 
stochastischen Beschreibung zu ermitteln, muss zunächst ein Verfahren zur 
Beobachtung der Zielgeschwindigkeit definiert werden. Anschließend können 
die übrigen Parameter aus dem Verhalten von vz abgeleitet werden. 


Der Fahrerwunschdynamikprozess Ig wird durch die Wahrscheinlichkeitsver- 
teilung des aktuellen Zustands 7%; und die Übergangsmatrix M beschrieben. Ein 
geeignetes Beobachtungsmodell P(O,|S;) zur Ermittlung der Zustandswahr- 
scheinlichkeiten ist ebenfalls zu ermitteln. 


Der die Routenoptionen abbildende Prozess T`, ist im Rahmen dieser Arbeit 
durch das in Abschnitt 3.5.2 beschriebene Verfahren (siehe Gl. (3.17) bzw. 
Gl. (3.18)) definiert. Da hierfür nur statische Parameter verwendet werden, ist 
keine Online-Identifikation notwendig. 


Zur Ermittlung der Prozessparameter von I’ muss somit der Vektor 0 mit 
(ba = {iz4, T} (3.26) 


bestimmt werden, wobei vz,, der aktuelle Schätzwert der Zielgeschwindigkeit 
und 7; die Verteilung der Zustandswahrscheinlichkeiten des HMM ist. Die 
Prozessparameter von I’ werden zu 


0 = {$ 05, HA, OA, Hmax, Omax, M } (8.27) 


zusammengefasst und sind aus dem Zeitverhalten von ® abzuleiten. 
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3.6.1 Methodik zur Verifizierung 


Reale Messfahrten sind von zentraler Bedeutung für die Validierung des Vorher- 
sagemodells. Um den Entwurf des stochastischen Modells zu validieren, muss 
aber zunächst das Verfahren zur Parameteridentifikation verifiziert werden. 
Die Verifikation kann dabei nicht direkt mit den realen Messfahrten durchge- 
führt werden, da es keine objektive Referenz für die Prozessparameter 0 gibt. 
Die grundsätzliche Eignung des Modells (Validierung) und die Korrektheit 
der Parameteridentifikation (Verifikation) müssen daher getrennt voneinander 
betrachtet werden. 


Zur Verifikation der Parameterschätzung bietet sich die Generierung eines 
künstlichen Datensatzes an, da in diesem Fall eine objektive Referenz für die 
Prozessparameter und Beobachtungsgrößen existiert und die Parameterinferenz 
somit bewertet werden kann. Für die Verifikation der Parameterinferenz wird 
daher zunächst davon ausgegangen, dass das Verhalten des Fahrers der zuvor 
formulierten Prozessformulierung folgt und entsprechende Testdaten mit dem 
Modell selbst erzeugt. 


Erzeugung virtueller Testdaten: 

Zur Datenerzeugung werden die Streckendaten der Teststrecke (Abschnitt 3.4) 
verwendet. Hierfür wird zunächst ein initialer Zustand So für die Fahrerwunsch- 
dynamik sowie eine initiale Zielgeschwindigkeit vz o definiert. Das Zielsegment 
sıD.ı Wird jeweils entsprechend des gegebenen Streckenverlaufs gewählt. Damit 
sind die Parameter der Transferfunktion für den ersten Zeitschritt (%) bestimmt. 


Mit den Parametern % und einem initialen Zustand yo erfolgt die schrittweise 
Berechnung einer Trajektorie y mit 


Yeo = fr W151, %, Tpsp,) » Vt - (3.28) 


Siehe hierzu auch Abschnitt 3.5.1. Für die Parameter % gilt dabei entsprechend 
der Prozessbeschreibung: 


(3.29) 


o Jhr falls t=k.cr,kEeN 
“= Y-ı sonst 
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Abb. 3.14 zeigt eine beispielhaften Geschwindigkeitsverlauf fiir die Initialzu- 
stände vz 0 = Vjim.o und So = 3 mit den Prozessparametern: 


= {9, Oe, Ua, OA, max; Omax,M} > 


(3.30) 
= {0.9, 1.0m/s,0m/s, 1.0m/s, 40m/s,0m/s,M} 
und der Ubergangsmatrix 
M = [pijlsxs 5 
= J095 falls i= j (3.31) 
Pij = 10.0125 sonst l 


Diese Werte der Übergangsmatrix führen zu einer mittleren Aufenthaltsdauer 
von 100s für einen Fahrerwunschdynamik-Zustand (Berechnung siehe Anhang 
A.3). Auf Grund der symmetrischen Matrix treten dabei alle Zustände der 
Fahrerwunschdynamik gleich wahrscheinlich auf. 


Abb. 3.14: Geschwindigkeitsverlauf v und Geschwindigkeitsbeschränkung v7;„, über der Strecke s 
für eine beispielhafte Realisierung des stochastischen Prozesses I für die gewählte Teststrecke. 


3.6.2 Rekursive Schätzverfahren 


Zur Ermittlung der Prozessparameter wird eine Schätzfunktion 6; für den 
jeweiligen Parameter 6; benötigt. Ist eine Beobachtungsreihe x]., einer Zufalls- 
variablen x gegeben, wird eine Schätzfunktion für einen statistischen Parameter 
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meist tiber eine Summenfunktion der Beobachtungsreihe definiert. Der Mit- 
telwert u und die Varianz o? dieser Beobachtungsreihe werden z.B. über das 
arithmetische Mittel bzw. die korrigierte Stichprobenvarianz geschätzt: 


1 n 
fl — Xi, 
n iZ 
P (3.32) 
a2 ny 
5 n—1 Lo A) 
Die Schätzwerte sind somit in Form einer Funktion 
Ô; n = fin) (3.33) 


definiert. 


Für Online-Parameterschätzungen (echtzeitfähige Schätzung zur Laufzeit der 
Funktion) ist diese Form der Schätzfunktion von Nachteil, da der Speicherbe- 
darf der Beobachtungsreihe x1:n und die benötigte Rechenzeit zur Ermittlung 
des Schätzwertes mit der Länge der Zeitreihe (n) zunimmt. Ziel eines rekursiven 
Schätzverfahrens ist es daher, die Schätzfunktion über eine Rekursionsglei- 
chung als rekursive Folge zu definieren. Die rekursive Schätzfunktion muss 
hierfür in einer Form 


Ô; n = f(6in-1) +f (Xn) (3.34) 


definiert werden, da so nur der letzte Schätzwert Ôi n—1 und die neue Beobach- 
tung x, benötigt werden. Rechenzeit und Speicherbedarf sind somit begrenzt 
bzw. konstant. 


Zur Schätzung von Parametern werden die Momenten- und die Maximum- 
Likelihood-Methode angewandt. Im Allgemeinen besitzen Schätzer basierend 
auf der Maximum-Likelihood-Methode überlegene statistische Eigenschaften 
gegenüber denen der Momentenmethode. In manchen Fällen kann die Berech- 
nung der Maximum-Likelihood-Schätzwerte aber aufwendiger sein als mit der 
Momentenmethode. Wegen dieser einfacheren Berechnungsweise wird häufig 
auch die Momentenmethode eingesetzt. (Haz11) 
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Zielgeschwindigkeit 


Der erste Schritt in der Parameterschätzung des Zielgeschwindigkeitsprozesses 
I’, ist die Ermittlung einer Beobachtungsreihe Vz ,. Dabei muss berücksichtigt 
werden, dass die Fahrgeschwindigkeit während Kurvenfahrten und Beschleu- 
nigungsvorgängen die Zielgeschwindigkeit unterschreitet. Die Zielgeschwin- 
digkeit kann somit nicht durchgängig beobachtet werden. Im Folgenden wird 
ein Verfahren zur Filterung der Zielgeschwindigkeit beschrieben. Dabei wird 
bei Überschreitung der geschätzten Zielgeschwindigkeit die aktuelle Fahrge- 
schwindigkeit als neue Zielgeschwindigkeit übernommen. Bei Unterschreitung 
der Zielgeschwindigkeit wird diese nur übernommen, wenn Längs- und Quer- 
beschleunigung für eine definierte Zeit unterhalb vorgegebener Schwellwerte 
bleiben (,‚Konstantfahrt“). Bei einer Änderung der aktuellen Geschwindigkeits- 
beschränkung wird die Zielgeschwindigkeit mit dem geschätzten mittleren 
Offset ua zu diesem Geschwindigkeitslimit reinitialisiert. Dieses Verfahren ist 
in Algorithmus 1 (S. 57) beschrieben. 


Dabei ist zu berücksichtigen, dass die Beobachtungsreihe zur Parameterschät- 
zung der Zeitdiskretisierung des Prozesses c,r: Ar folgen muss. Die Be- 
obachtungsreihe mit dieser Zeitdiskretisierung wird im Folgenden f, „ be- 
zeichnet, wobei r’ der zu ¢ zugehörige Zeitindex mit der Schrittweite Gr 
ist. Wird während c; r Zeitschritten keine Beobachtung für Vz zugewiesen 
(validObservation in Alg. 1), wird die Beobachtung als fehlende Beobachtung 
behandelt. Fehlende Beobachtungen werden für die Parameterschätzung nicht 
berücksichtigt. 


Abb. 3.15 zeigt beispielhafte Ausschnitte aus einer Messfahrt und die mit Al- 
gorithmus 1 identifizierte Beobachtungsreihe %%,. In Abb. 3.15(a) liegt eine 
Situation ohne Kurveneinschränkungen vor. Entsprechend ist die beobachtete 
Geschwindigkeit im Wesentlichen durch die Zielgeschwindigkeit bedingt und 
die Beobachtungsreihe 9% folgt entsprechend dem Geschwindigkeitsverlauf 
v. In Abb. 3.15(b) liegen zahlreiche Kurveneinschränkungen vor. Die Beob- 
achtbarkeit der Zielgeschwindigkeit ist dadurch eingeschränkt. Zu Beginn des 
Abschnitts (t ~ 1220s) kann zunächst keine Beobachtung für die Zielgeschwin- 
digkeit gemacht werden, weil die Beschleunigungsphase nach dem Wechsel 
des Geschwindigkeitslimits direkt in eine Verzögerung auf eine Kurve übergeht. 
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Algorithmus 1 : Filterung Vz, 
Input : vsz, y 


Output : z, 0% 
begin 
vz.0 <— Vlim,0; 
for t + 1,0 do 
valid Observation + false; 
if Vlim,t # Viim,t—1 then 
/* Neues Geschwindigkeitslimit */ 
L Vz 4+ Viimt + Has 
if v, > Vz, then 
/* Erhöhung der Zielgeschwindigkeit */ 
Vz vr; 
validObservation < true; 
else 
if lax.| < dy, Grenz & lay.| < dy, Grenz then 
timer.start(); 

else 

timer.stop(); timer.reset(); 


if timer.timeRunning() > tGrenz then 

/* Verringerung der Zielgeschwindigkeit 
*/ 

Vz vr; 

timer.stop(); timer.reset(); 

validObservation < true; 


if ~ validObservation then 
| Wag Oz 4-15 

if [zs — v| < AVGrenz then 
valid Observation < true; 


if validObservation then 
Oy = Vz; 
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Abb. 3.15: Gefahrene Geschwindigkeit v, Beobachtungen der Zielgeschwindigkeit Wy und Ge- 
schwindigkeitsbeschränkung vj;„ für Ausschnitte aus Realfahrten ohne (a) und mit (b) relevanter 
Kurveneinschränkung. Fehlende Beobachtungen für A , werden durch leere Kästchen markiert. 


Wie bereits zuvor geschildert, können die realen Messfahrten nur für eine sub- 
jektive Verifizierung der Zielgeschwindigkeitsidentifikation verwendet werden. 
In Abb. 3.16 ist die identifizierte Zielgeschwindigkeit für das Beispielprofil aus 
Abschnitt 3.6.1 dargestellt. Da das Profil simulativ erzeugt wurde, kann hier 
auch der tatsächliche Verlauf der Zielgeschwindigkeit vz abgebildet werden. 
Die mittlere absolute Abweichung zwischen tatsächlicher und geschätzter Ziel- 
geschwindigkeit beträgt für dieses Profil 0.93 m/s. In Abb. 3.16(b) ist erneut 
eine Situation mit mangelnder Beobachtbarkeit durch Kurven dargestellt. Die- 
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Abb. 3.16: Gefahrene Geschwindigkeit v, tatsächliche und geschätzte Zielgeschwindigkeit vz, und 


% y für die gesamte Teststrecke (a) und einen Ausschnitt (b). 


se Beispielsituation zeigt, dass Alg. 1 diese Änderungen erfolgreich von der 
Zielgeschwindigkeit separiert. 


Mit der geschätzten Beobachtungsreihe Y, können die zugehörigen Prozess- 
parameter ermittelt werden. Da sich die Verteilung Vı relativ zum Geschwin- 
digkeitslimit definiert, ist dies bei der Schätzung der Verteilungsparameter 
entsprechend zu berücksichtigen. Zufallsereignis ist in diesem Fall der Wechsel 
eines Geschwindigkeitslimits. Das heißt, der Mittelwert ua und die Standard- 
abweichung Oa können nicht direkt aus der Zeitreihe z berechnet werden, 
sondern müssen in eine Beobachtungsreihe über die Geschwindigkeitsbeschrän- 
kungen transformiert werden. 
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Aus der Beobachtungsreihe » kann mit den jeweils gültigen Geschwindig- 
keitsbegrenzungen vj;m,; die Reihe der Abweichungen ?, mit 


& ap 
Vat! = Vz, — Vlim (3.35) 


ermittelt werden. Der arithmetische Mittelwert, der zu einem Geschwindig- 
keitslimit vjjm,; gehörigen Abweichungen, sei mit V4 ; bezeichnet, die mittlere 
Zielgeschwindigkeit entsprechend vz ;. Die Schätzwerte für Va lassen sich dann 
mit 


1 n 
Ban me Vai > 
n iZ 
1 2 (3.36) 
Gin = Yi (Pas Alan) 2 > 1 


ermitteln. Gl. (3.36) lässt sich in eine rekursive Berechnungsvorschrift um- 
wandeln (Herleitung siehe A.4). Die resultierende rekursive Schätzfunktion 
lautet: 


7 n—|1, 1_ 

UAn = HAn-ı + nian > 

u is i. : (3.37) 
Can = 7 _ 7 An-1 „Wan Ban-ı),n>1. 


Für viele Messungen (n — æ) hat eine einzelne Messung VA n nur noch ge- 
ringen Einfluss auf den Schätzwert. Da sich der beobachtete Prozess nicht 
zwangsläufig stationär verhält — also auch über der Zeit variieren kann — wird 
üblicherweise eine Begrenzung der Samplegröße für eine rekursive Berech- 
nungsvorschrift vorgenommen. Dies ermöglicht eine Adaption auf Änderungen 
in den Parametern auch nach vielen Messungen. Die modifizierte Berechnungs- 
vorschrift lautet dann 


A-1, dl 
MT a n—1 T 7 VAn» 
Ha 7 Man-ı F va, 
= A-2., 1 x 3.38 
Ôi n = 2—1 NE + 7 Wan Mant) ‚n> 1 ( ) 
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Die Parameter der Verteilung bei unbeschränkter Strecke werden dementspre- 
chend ermittelt. Die Schätzfunktion lautet hier dann 


eens 1 
Umax,n = 7 Umax,n—1 x Z,n > 
1 


22 A-2 49 


_ = 2 
Omax,n = 7-1 Omax,n—1 T z = Ümax.n-ı) nl, 


(3.39) 
mit A = min (n, nmax) - 


Mit dem Verfahren zur Identifikation der Zielgeschwindigkeit (Alg. 1) und 
den rekursiven Berechnungsvorschriften (Gl. (3.38) und (3.39)) kann die Pa- 
rameterinferenz des Zielgeschwindigkeitsprozesses verifiziert werden. Hier- 
für werden die Parameter ua und oy variiert und ein entsprechendes Set 
virtueller Testfahrten erzeugt. Die übrigen Parameter werden dabei wie in 
Abschnitt 3.6.1 beschrieben gesetzt. Insgesamt werden 50 Simulationen mit 
Ua »U(-5m/s,5m/s) und oa ~ U(Om/s,3m/s) durchgeführt. 


Abb. 3.17 zeigt die Schätzwerte der Parameter am Ende der jeweiligen Testfahrt. 
Wie in Abb. 3.17 (a) ersichtlich konvergieren die Schätzwerte fi, zu den realen 
Werten ua (Punktwolke um Ursprungsgerade mit Steigung 1). Die Schätzwerte 
6, hingegen liegen vor allem für kleine o, etwas oberhalb der tatsächlichen 
Werte. Für kleine Standardabweichungen o, wird die Unsicherheit somit über- 
schätzt. Die Wurzel des mittleren quadratischen Fehlers (RMSE - root mean 
square error) für beide Schätzwerte liegt dabei in einem Bereich < 1 m/s und 
ist somit relativ gering. 


Die systematische Überschätzung der Streuung für kleine o, ist durch die 
Überlagerung des autoregressiven Prozesses zu erklären, der selbst für den 
theoretischen Fall o, = 0 zu einem Erwartungswert E(6,) > 0 führt. Da Ay n 
der geschätzte Mittelwert eines AR(1)-Prozesses? ist, gilt für E(62): 


(8%) = Var(fa) = E(Ax) —E(fia)? . (3.40) 


9 Autoregressiver Prozess erster Ordnung 
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5 — 3 
RMSE = 0.671 m/s w rh RMSE = 0.531 m/s A 
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Abb. 3.17: Schätzwerte für Mittelwert A, (a) und Standardabweichung ô? (b) für die Verteilung 
Vz des Geschwindigkeitsniveaus, dargestellt über die tatsächlich simulierten Werten der Parameter 
für 50 zufällige Konfigurationen von ua und oy. 


Für den AR(1)-Prozess aus Gl. (3.23) gilt E(fi,) = 0 (KWH13). Damit folgt 
weiter: 


(3.41) 


Da sehr geringe Standardabweichungen oy als theoretischer Grenzfall zu be- 
trachten sind (idealisiertes Fahrerverhalten), kann die Verzerrung des Schätz- 
wertes in diesem Bereich toleriert werden. 


Parameter des AR(1)-Prozesses: Neben den Parametern der Verteilung Vz 
müssen die Parameter des autoregressiven Prozesses (@, o2) geschätzt wer- 
den. Sei zunächst vag, eine Zeitreihe realisiert durch einen AR(1)-Prozess. 
Der ML-Schätzwert (Maximum Likelihood) für @ kann nur durch numeri- 
sche Minimierungsverfahren ermittelt werden (CC08), wodurch dieser für 
eine Online-Schätzung nicht in Frage kommt. Abhilfe bieten hier die CML- 
Schätzwerte (Conditional Maximum Likelihood) unter Bedingung der ersten 
Beobachtung x1. Der CML-Schätzwert fiir @ ist durch 


py (var. — VAR) (VAR 1—1 — VAR) 
CML _ 1/=2 (3.42) 


n n 
E (vare-ı — AR)? 
t=2 
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gegeben. Der CML-Schätzwert für 02 ist durch 


n 


P 1 _ _ 972 
ra u L [(varw — Var) — 9 (Vars —1 — Var)] (3.43) 
f=2 


gegeben. Da sich die CML-Schätzwerte für große Samplegrößen nicht von den 
exakten ML-Schätzwerten unterscheiden, können diese als einfacher handhab- 
bare Alternative eingesetzt werden (CC08). 

Die rekursiven Berechnungsvorschriften für die Schätzwerte ĝ 
werden in Anhang A.5 hergeleitet. 


CML +2 CML 
n und Ozn 


Für die Schätzung der AR-Parameter ist zu beachten, dass vag nicht der 
beobachteten Zeitreihe v4 entspricht, da diese durch die Verteilung Vz mittel- 
wertsbehaftet ist und zusätzlich Sprünge in der Zeitreihe bei einem Wechsel 
der Geschwindigkeitsbeschränkung auftreten können. Die Zeitreihe >, muss 
also zunächst in eine mittelwertsfreie Zeitreihe umgewandelt werden. Die 
mittelwertsfreie Beobachtungsreihe ist 


Pare = Par — VAi (3.44) 


wobei vı,; die mittlere Abweichung von der geltenden Geschwindigkeitsbe- 
schränkung v/;„,; ist. Für ein rekursives Verfahren ist diese Umwandlung nicht 
exakt möglich, da v4; immer erst nach Beendigung eines Beschränkungsab- 
schnittes ermittelt werden kann. Um die rekursive Berechnung zu ermöglichen, 
kann für v4; als Schätzwert die erste Beobachtung va ;, dieses Beschränkungs- 
abschnittes verwendet werden. Dadurch ergibt sich die Zeitreihe 


At x 
VAR J! = Vat — VAty ` (3.45) 


Für die Verifizierung werden jetzt die Parameter @ und Og variiert, die üb- 
rigen Parameter werden erneut, wie in Abschnitt 3.6.1 beschrieben, gesetzt. 
Es werden 50 Simulationen mit ọ ~ U(0.5,1.0) und Ge ~ U (0 m/s,2 m/s) 
durchgeführt. 


Abb. 3.18 zeigt die Schatzwerte für @ und Og. Die Varianz Og wird in beiden Fäl- 
len für größere Og leicht unterschätzt. Auffällig ist die schlechte Schätzung des 
Parameters @, wobei @ vor allem für kleinere Werte deutlich überschätzt wird. 
Dabei ist zu beachten, dass die beobachtbare Zeitreihe der Geschwindigkeit 
durch das Fahrer- und Fahrzeugverhalten gefiltert ist und daher Änderungen der 
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Zielgeschwindigkeit nicht unmittelbar folgt. Siehe hierzu auch das Beispiel in 
Anhang A.6. In diesem Beispiel wird ein AR(1)-Prozess mit der durch ein PT - 
Glied gefilterten Zeitreihe des Prozesses verglichen. Das Beispiel verdeutlicht, 
dass die beobachtete Zeitreihe eine deutlich höhere Autokorrelation aufweist, 
als der erzeugende AR(1)-Prozess. Weiterhin ist mit einer Unterschätzung der 
Autokovarianz und damit og zu rechnen. Das Beispiel zeigt, dass eine geringe 
Autokorrelation @ in einer solchen Situation nur bedingt beobachtbar ist, da die 
resultierende Geschwindigkeitstrajektorie eine systematisch höhere Korrelation 
aufweist. 


Da der Parameter @ wegen der eingeschränkten Beobachtbarkeit nicht zufrie- 
denstellend geschätzt werden kann, wird eine Annahme für den Parameter 
basierend auf den Realfahrdaten ermittelt. Eine entsprechende Untersuchung 
hierzu wird in Abschnitt 3.8 durchgeführt. Im Folgenden wird zunächst von 
einem bekannten Parameter @ ausgegangen. Abb. 3.19 zeigt die Schätzwerte für 
ġ und o, unter Annahme eines bekannten Parameters @. Die Schätzwerte für 
co? weisen bei Bekanntheit des Parameters @ nochmals einen etwas geringeren 
Fehler auf als zuvor. 


Mit Ausnahme des Autokorrelationsparameters @ können die Parameter des 
Zielgeschwindigkeitsprozesses somit mit hinreichender Genauigkeit rekursiv 
ermittelt werden. 


i RMSE = 0.158 2 RMSE = 0.335 m/s 
. 3° 
+ Ee a os 1.5 oo ° 
+ - + n aii 
0er” Br, JE Á Pi tas 
I $ ve to l a. tf 
t a © . x + hig wey 
0.6 . . Ost DE Zu 
i + RY 
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Abb. 3.18: Schätzwerte ri (a) und 6; (b) des AR(1)-Prozess, dargestellt über den tatsächlich 
simulierten Werten für 50 zufällige Kombinationen von @ und Og. 
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Abb. 3.19: Schätzwerte ri) (a) und 6, (b) des AR(1)-Prozess bei Annahme eines bekannten Parame- 
ters @ (® = @)s, dargestellt über den tatsächlich simulierten Werten für 50 zufällige Kombinationen 
von ® und Og. 


Fahrerwunschdynamik 


Ähnlich zum Prozess der Zielgeschwindigkeit, muss auch zur Ermittlung der Pa- 
rameter der Fahrerwunschdynamik zunächst eine Beobachtungsreihe ermittelt 
werden. Bei einem HMM ist dies die zeitabhängige Wahrscheinlichkeitsvertei- 
lung 7, der Zustände. Hierfür muss ein Beobachtungsmodell P(O,|S;) definiert 
werden. Dieses Modell gibt dabei die Wahrscheinlichkeit einer Beobachtung O; 
für den Zustand S; an. Da die Zustände S, die Fahrerwunschdynamik repräsen- 
tieren, ist es naheliegend die Größen a,+, a,_ und a, als Beobachtungsgrößen 
zu verwenden, wobei 


gilt. 


ax, falls ay > 0 
dy. — 
= 0, sonst 
(3.46) 
ax, falls ay < 0 
Ü= 
0, sonst 
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Da der Prozesszeitschritt c; r - Ar größer als die Abtast-Schrittweite der Beob- 
achtungsreihe (a,+, dy, ay) ist, werden die Beobachtungsgrößen wie folgt 
definiert: 


A; 
O14 max dx+(t) 
= 1033) = min a,_(f) (3.47) 
O3, 
‘] [ma |ay(2)| 


Für jede der Beobachtungsgrößen O;, wird eine Beobachtungswahrschein- 
lichkeit P(O;,;|S;) gebildet. Die kombinierte Beobachtungswahrscheinlichkeit 
für die vektorielle Beobachtungsgröße ist dann durch Linearkombination der 
einzelnen Beobachtungswahrscheinlichkeiten mit 


P(O;|S;) = P(O1.:|S:) : P(O2.|S:) - P(O3.:|S:) (3.48) 


gegeben. 


Die Anzahl der verwendeten Markov-Zustände für das Hidden-Markov-Modell 
legt die Diskretisierung der Fahrerwunschdynamik und damit die Genauigkeit 
und Flexibilität der Abbildung fest. Die Anzahl der sinnvollen Zustände ist aber 
auch durch die Beobachtbarkeit und Trennbarkeit dieser Zustände beschränkt. 
Im Folgenden werden als Kompromiss aus Beobachtbarkeit und Genauigkeit 
der Darstellung fünf Fahrerwunschdynamik-Zustände für das Hidden-Markov- 
Modell gewählt. Längs- und Querdynamikparameter werden dabei äquidistant 
im relevanten Bereich verteilt. Zur Definition einer Radleistungsgrenze kann 
die Verteilung der Beschleunigungen über der Geschwindigkeit hinzugezogen 
werden (siehe Abb. A.2). Unter Berücksichtigung dieser Daten wird für die 
Radleistungsgrenze die benötigte Radleistung zur Erreichung der Maximalbe- 
schleunigung a, auf ebener Straße bei 100 km/h gewählt. Dieser Wert wird als 
pio bezeichnet. Die Ruckgrenze wird so gewählt, dass die Maximalbeschleu- 
nigung innerhalb von zwei Sekunden aufgebaut wird. Die entsprechenden 
Parametertupel sind in Tabelle 3.2 aufgeführt. 


Zur Verifikation des Beobachtungsmodells werden fünf Simulationen durch- 
geführt, wobei der Fahrerwunschdynamik-Zustand S; jeweils konstant auf 
einen der fünf Zustände gesetzt wird. Die übrigen Parameter werden entspre- 
chend Abschnitt 3.6.1 gewählt. Abb. 3.20(a) zeigt beispielhaft die relative 
Häufigkeitsverteilung für die positiven Längsbeschleunigungen ay. Dabei 


66 


3.6 Parameterinferenz 


Tabelle 3.2: Parametertupel f; 5; der den Markov-Zuständen i zugeordneten Fahrerwunschdynamik- 
parametern: Längsbeschleunigungs- und Längsverzögerungsgrenzen ay max Und Ay min, tolerierte 
Querbeschleunigung a, max, Radleistungsgrenze Pmax und Ruckgrenze jmax. 


ax max Ax min ay max Pmax Jmax 
Ya,ı 1.5m/s? -1.5m/s* 2.0m/s? PD a 075 m/s? 
Ya2 2.25 m/s? -2.25 m/s? 3.0m/s? P! mye 1.125 m/s? 
a3 3.0m/s? -3.0m/s? 4.0. m/s? ee 1.5 m/s? 
Va, 3.75 m/s? -3.75 m/s? 5.0 m/s? PN 2 1.875 m/s? 
Yas 4.5 m/s? -4.5 m/s? 6.0. m/s” PIO a 2.25 m/s? 


ist zu beachten, dass diese Verteilungen synthetische Charakteristiken auf- 
weisen, da das Simulationsmodell die exakten Grenzwerte für Längs- und 
Querbeschleunigungen einregelt. Das Beispiel zeigt, dass auch für den dyna- 
mischsten Fahrerzustand S, = 5 situationsbedingt Beschleunigungen kleiner 
des entsprechenden Grenzwerts auftreten. Dieser Effekt zeigt sich auch für die 
übrigen Beobachtungsgrößen, da beispielsweise die Querbeschleunigung nicht 
nur von der Fahrerwunschdynamik abhängt, sondern auch der Kurvigkeit der 
Strecke und den gesetzlichen Geschwindigkeitsbeschränkungen. Diese Häufig- 
keitscharakteristiken müssen im Beobachtungsmodell berücksichtigt werden. 
Grundsätzlich wird als Beobachtungsmodell daher ein Gaussian Mixture Mo- 
del (GMM) bestehend aus zwei Gaußverteilungskomponenten gewählt, wobei 
eine Komponente den Mittelwert null besitzt und die andere einen Mittelwert 
entsprechend des Zustands der Fahrerwunschdynamik. Abb. 3.20(b) zeigt ein 
solches Beobachtungsmodell beispielhaft für die Längsbeschleunigung (Oj +). 


Sind das Beobachtungsmodell P(O;|S;) und die Zustandsübergangsmatrix M 
der Markov-Zustände gegeben, können für eine Beobachtungsreihe O; die 
Zustandswahrscheinlichkeiten 7, mit der forward-backward Zerlegung nach 
(BPSW70) ermittelt werden. Sei folgend K die Anzahl der Markov-Zustände 
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Axt [m/s?] Oit [m/s?] 


(a) (b) 


Abb. 3.20: (a) Relative Häufigkeitsverteilung h(a,|S;) der positiven Längsbeschleunigungen a, 
für die unterschiedlichen Fahrerwunschdynamik-Zustände S; = 1..5. Der Bereich a, œ 0 ist nicht 
vollständig abgebildet. (b) Gewähltes Beobachtungsmodell P(O; ;|S;) für die Beobachtung O1, 
für die unterschiedlichen Fahrerwunschdynamik-Zustände. 


und p;; die Übergangswahrscheinlichkeit P(Sı+ı = j|S; = i). Für die Wahr- 
scheinlichkeit 7, (i) des Zustands i zum Zeitpunkt ¢ gilt dann: 


m (i) = P(S: =i|O1r) = (3.49) 
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mit 2 
a, (j) = È œ- (i) ‘Pij: P(Oz|S; = j), Yt >1 
r (3.50) 
B,(i) = È PiU): Pi P(Or+1|Si41 = j) Vt<T 
wobei 
a (i) = m (i): P(O1|S1 = j), Vi € [1,K] (3.51) 


Br(i) =1, Vie [I,K]. 
(siehe z.B. (Rab89)) 


Fiir die numerische Umsetzung der forward-backward Zerlegung miissen die 
Größen a, und f; normiert werden, da diese sehr kleine Werte annehmen 
(Potenzierung kleiner Wahrscheinlichkeitswerte) und dadurch numerische Un- 
genauigkeiten entstehen (vgl. (Rab89, CMROS)). 


Zur Verifizierung des Beobachtungsmodells werden die fünf simulierten Bei- 
spielverläufe y verwendet. Die Übergangsmatrix M wurde zur Bestimmung 
der Übergangswahrscheinlichkeiten zunächst entsprechend Gl. (3.31) ange- 
nommen. Abb. 3.21 zeigt die mittels forward-backward Zerlegung bestimmten 
Wahrscheinlichkeiten 7, für die fünf Durchläufe. Es werden zwar in Einzelsi- 
tuationen die Zustände korrekt identifiziert, sehr häufig ist jedoch der Zustand 
S; = 1 der wahrscheinlichste Zustand in allen Fahrten. Tabelle 3.3 zeigt die 
mittlere Wahrscheinlichkeit P(S; =5§, ref) mit der der tatsächliche Zustand Ser 
identifiziert wurde. Für die Fahrten mit S,ef > 1 liegt diese bei unter 0.20. 


Tabelle 3.3: Mittlere Wahrscheinlichkeit P(S, = S ref) mit der der tatsächliche Zustand S,.; für S, 
identifiziert wurde. 


Gr lı 2 3 a 5 


P(S, = Srp) | 0.99 0.13 0.20 0.10 0.14 


Dieses Beispiel verdeutlicht, dass nicht alle Beobachtungen O, als Ausgabe ei- 
nes Zustands (sog. Emission) betrachtet werden können, da die Beobachtungen 
nur in Situationen mit vorhandener Quer- oder Längsdynamik mit der Fah- 
rerwunschdynamik korrelieren. Die herkömmliche Formulierung eines HMM 
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Abb. 3.21: Zustandswahrscheinlichkeiten 2, der Markov-Zustände S, für den Zeitpunkt r und 
tatsächlicher Zustand $,.r für die fünf simulierten Fahrten. Da für die Simulationen Weggleichheit 
gilt, ist die Zeitdauer bei dynamischerem Fahrerverhalten (S;¢¢ = 5) entsprechend kürzer (S,ef = 1). 


bedingt aber diese Beziehung zwischen Beobachtung und Zustand. Um diese 
Beziehung aufzulösen und das Beobachtungsmodell entsprechend anzupassen, 
kann das HMM um eine Emissionswahrscheinlichkeit Pr (O;,) erweitert wer- 
den (FHFG17). Pg (O;,;) stellt dabei die Wahrscheinlichkeit dar, dass O;, eine 
Emission des Zustands $; ist und somit vom Zustand S, abhängt. Ist O;; keine 
Emission, ist die Beobachtung vom Zustand unabhängig und somit für alle 


70 


3.6 Parameterinferenz 


Zustände gleich wahrscheinlich!®. Für die modifizierten Beobachtungswahr- 
scheinlichkeiten gilt dann 


P*(O;.|$:) = Pe(Ois)P(Ois|St) + (1 —Pe(Ois)) , Vi € [1,3],  @.52) 
und fiir die kombinierte Beobachtungswahrscheinlichkeit entsprechend 


P*(O,|S;) = P*(01;|S;) - P* (O2 .:|S) - P* (O3 |Sı) .(FHFG17) (3.53) 


Die Emissionswahrscheinlichkeiten werden so definiert, dass sie gegen den 
Wert | streben, wenn eine entsprechende Dynamik vorhanden ist bzw. vor- 
handen sein sollte. Für die langsdynamischen Beobachtungen O1, und O2, 
(Beschleunigung und Verzögerung) wird die Emissionswahrscheinlichkeit da- 
her abhängig von der Geschwindigkeitsdifferenz in einem Zeitfenster c; r - At 
gewählt. Für die Querdynamik (O03) wird die Emissionswahrscheinlichkeit 
Pg abhängig von der bei Geschwindigkeit v7;„, zu erwartenden Querbeschleu- 
nigung bei gegebener Kurvenkriimmung K definiert. Die Berechnung von 
Pg (Oir) erfolgt dementsprechend nach 


A O 
P2(01,) = max ( £ : t ) 
AVref Ax+ ref 
Av O 
Pg (O24) = max ( : š al ) 
—AV ref Ax— ref (3.54) 
2 
eK O 
Pz (031) = max et ra ) ; 
Ay ref Ay ref 


u.B.v. Pz(O;;) € [0, 1] Vi. (Vgl. (FHFG17)) 


Abb. 3.22 zeigt die entsprechenden Zustandswahrscheinlichkeiten 7, mit der 
modifizierten Beobachtungswahrscheinlichkeit nach Gl. (3.53) für geeignete, 


10 Für den Fall, dass die Beobachtung O;, keine Emission eines Zustands ist, gilt nach Gleichung 
3.52 Pg (Oj) = 1. In Folge ist die Beobachtungswahrscheinlichkeit P*(O;;|S;) = 1 für jeden 
Zustand $,. Eine Beobachtungswahrscheinlichkeit P*(O;;|S;) = 1 für alle Zustände führt dazu, 
dass die Beobachtung O;, keinen Einfluss auf die Wahrscheinlichkeit eines Zustandsverlaufs hat 
(siehe Gleichung 3.53) und somit neutral in die Ermittlung der Zustandswahrscheinlichkeiten 
eingeht. 
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empirisch ermittelte Referenzgrößen (Av,ef, Ax+, ref, Ax— ref, Ay,ref). In Tabel- 
le 3.4 ist die entsprechende mittlere Wahrscheinlichkeit für die Identifika- 
tion des korrekten Zustands $; = S,ef aufgeführt. Mit der Erweiterung um 
die Emissionswahrscheinlichkeit ermittelt das HMM den wahrscheinlichsten 
Fahrerwunschdynamik-Zustand korrekt für alle Beispielprofile. Die Schärfe 
der Zustandswahrscheinlichkeitsverteilung hängt dabei von der Ausprägung 
der Situation ab. In kurvigen Abschnitten mit zahlreichen Beschleunigungen 
sind die Zustandswahrscheinlichkeiten entsprechend schärfer abgetrennt als in 
Abschnitten ohne eindeutige Fahrerwunschdynamik-Indikatoren. 


Tabelle 3.4: Mittlere Wahrscheinlichkeit P(S, = S ref) mit der der tatsächliche Zustand S,.r für S; 
identifiziert wurde beim Einsatz der modifizierten Beobachtungswahrscheinlichkeit P*(O;|S;). 


Sp |a 2 a a $ 


P(S,=Srep) | 0.84 0.79 0.69 0,57 0.77 


Die Parameter des HMM, folgend © bezeichnet, sind die Zustandsiibergangs- 
wahrscheinlichkeiten P(S;41 = j|S; = i) bzw. die Matrix der Ubergangswahr- 
scheinlichkeiten M und das Beobachtungsmodell P(O;|S;). Da das Beobach- 
tungsmodell in diesem Fall eine vorgegebene Beschreibung der Zustände und 
ihrer Bedeutung ist, wird dieses nicht mit den üblichen Verfahren zur Parame- 
terschätzung adaptiert, sondern wird im Folgenden wie hergeleitet verwendet.!! 


Für die Herleitung des Beobachtungsmodells wurde die Übergangsmatrix M 
bisher als gegebene, symmetrische Matrix (Annahme: alle Zustände treten 
gleich häufig auf) angenommen. Für die Schätzung der Übergangswahrschein- 
lichkeiten p;; werden die Zustandswahrscheinlichkeiten 7, benötigt. Für die 


I Im Allgemeinen Fall sind die Zustände eines HMM abstrakt, d.h. ihnen ist keine konkrete, 
vorgeschriebene Bedeutung zugewiesen. Die Zustände werden in einem solchen Fall verwen- 
det um das Verhalten von Beobachtungsketten zu modellieren, wobei die Zusammensetzung 
des Systems (innere Zustände) nicht bekannt ist. Durch die Maximierung der Beobachtungs- 
wahrscheinlichkeit einer realen Beobachtungskette durch Adaption des Modellparameter, wird 
versucht eine möglichst gute Abbildung des realen Verhaltens der Beobachtungskette zu erzielen. 
Da die Bedeutung der Zustände im Kontext dieser Arbeit vorgeschrieben ist, darf das Beobach- 
tungsmodell nicht durch z.B. Expectation-Maximization adaptiert werden. Das HMM würde 
ansonsten im Trainingsprozess die Bedeutung der Zustände modifizieren, sodass z.B. ein Zustand 
der Fahrsituation „Geradeaus Fahrt“entspricht, während ein anderer „Kurvenfahrt“repräsentiert. 
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Abb. 3.22: Zustandswahrscheinlichkeiten 77, der Markov-Zustände S; für den Zeitpunkt ? und 
tatsächlicher Zustand S,.y für die fünf simulierten Fahrten. Zur Ermittlung von 7 wurden hier die 
modifizierten Beobachtungswahrscheinlichkeit P*(O,|S,) verwendet. 


Ermittlung dieser Zustandswahrscheinlichkeiten werden aber wiederum die 
Übergangswahrscheinlichkeiten p; j benötigt. Die Parameteridentifikation eines 
HMM wird daher auch als Maximum-Likelihood-Schätzung mit unvollstän- 
digen Daten bezeichnet. Ein geeignetes Verfahren zur Schätzung der HMM- 
Parameter ist die Expectation-Maximization-Methode (EM). EM ist eine ite- 
rative Methode, wobei im „Expectation“ Schritt die Erwartungswerte (z.B. 
Zustandswahrscheinlichkeiten mittels forward-backward-Zerlegung) basierend 
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‘ 


auf einer Schätzung der Parameter © ermittelt werden. Im „Maximization‘ 
Schritt wird basierend auf den Erwartungswerten eine ML-Schätzung der Para- 
meter © ermittelt. Für HMM wird der EM-Algorithmus üblicherweise auch 
als Baum-Welch-Algorithmus bezeichnet. Für eine ausführliche Beschreibung 
des Baum-Welch-Algorithmus siehe (BPSW70, DL77, RJ86, Rab89, Bil98, 
Gha01, CMROS). 


Sowohl die Forward-Backward-Zerlegung als auch der Baum-Welch-Algorith- 
mus erfordern dabei das Vorliegen einer Zeitreihe fiir O,. Diese Algorithmen 
sind damit nur bedingt für den echtzeitfähigen Online-Einsatz geeignet, da 
sie keine rekursive Formulierung ermöglichen. Eine echtzeitfähige Online- 
Schätzung ist aber wichtig um die Parameter des Fahrermodells während einer 
Fahrt direkt adaptieren zu können. An dieser Stelle wird der Ansatz nach 
(Cap11) vorgestellt: 

Die übliche (offline) Vorgehensweise des EM-Algorithmus in der k-ten Ite- 
ration ist die Berechnung des Erwartungswerts einer suffizienten Statistik 
5(S;—1,5;,O;) mit 


1 n 
Sn.k- = = z $ s(S}-1,51,0r) Oi: (3:35) 
t=2 
und die anschließende ML-Schätzung der Parameter 
O41 = O(Sk+ı), (3.56) 


unter der Annahme, dass die Funktion @(S) den Maximum-Likelihood- 
Schätzwert basierend auf der vollständigen Statistik S liefert. Gegeben seien 
nun 


Ta (i) = P(S; = i|O1-n) (3.57) 
und die Hilfsgröße 
1i |g l 
Pn(i) = Ba È S(St—1,S1,01)[O1:n;Sn = | : (3.58) 
t=2 
Mit 


n 


È m (i)pa(i) -lg BB s(Si—1, S1, 0+) 


n [2 


On| = Sn (3.59) 
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ergibt sich dann die gesuchte Statistik des (offline) EM-Algorithmus. Der 
Vorteil dieser Zerlegung ist die Möglichkeit der rekursiven Aktualisierung der 
Größen nach folgender Vorschrift: 
Initialisierung: 
_ Mi) P(Oi|S; =i) 

zm(j)- PO: =j) (3.60) 


pili) =0, 
wobei 7% eine initiale Annahme für die Ausgangsverteilung der Zustände ist. 
Rekursion: Vi 


m (i) 


Im) -P(Sytı = ilS =j) -P(Sa+ı = i]On41) 
4 


= ; 3.6la 
EETU) Ps = Ky =D) Plön Klon) OP 
3 


Mn+ (i) 


; 1 BR n : BE 
Pn+i(i) = 2 (0i On) ag PH) ml); (3.61b) 


J 


mit der retrospektiven Wahrscheinlichkeit 


rn+i (jli) P(S, J\Sn-+ı i, Oo:n) 
= Tn (J)P(Sn41 = [Sn = j) . (3.62) 
E a (K)P (Sati = i|S, =k) 


Um numerisch zuverlässiges Verhalten zu garantieren, wird der „Maximizati- 
on“-Schritt erst ab einer Mindestanzahl an Beobachtungen durchgeführt. Daher 
gilt für den ML-Schätzwert der Online-Variante des EM: 


O(L An (i)Pn(i)) falls n > Min 


On sonst 


nl = 


(3.63) 


Für die notwendigen Statistiken s(S;—1, S+, O+) zur Schätzung der Übergangs- 

matrix sei auf (Cap11) verwiesen. Man beachte, dass Gl. (3.61b) die üblichen 

rekursiven Gewichtungen oH und ST enthält (vgl. Gl. (3.37)). Zur Erhal- 

tung der Anpassungsfähigkeit bei zeitveränderlichem Verhalten wird auch hier 
1 


die Begrenzung der Gewichtungen auf 7 und 4 mit A = min (n, nmax) 
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vorgenommen. Man beachte weiter, dass im Gegensatz zu den vorhergehend 
behandelnden Prozessparametern, bei Modellen mit unvollständigen Daten 
die Schätzwerte der rekursiven und nicht-rekursiven Verfahrensweise nicht 
vollkommen identisch sind. Das rekursive Verfahren wird im Folgenden als 
Online-EM bezeichnet. 


Für die Verifizierung der Schätzung der Übergangsmatrix M werden erneut 
virtuelle Testfahrten erzeugt. Dabei werden drei Simulationen durchgeführt, die 
beispielhaften ruhigen, durchschnittlichen und sportlichen Fahrern entsprechen. 
Die zugehörigen Matrizen Mı, M2 und M3 sowie deren stationäre Verteilung 
To (Aufenthaltshäufigkeiten der Zustände für t — æ) sind in Anhang A.7 
aufgeführt. Als initiale Schätzung Mo wird die symmetrische Matrix 


M = [pij]sx5 » 
re 0.9 falls i=j (3.64) 
Pij = 0.025 sonst 


gewählt. 


Beispielhaft sind in Abb. 3.23 die identifizierten Zustandswahrscheinlichkeiten 
für die Testreihe mit dem durchschnittlichen Fahrer (M2) und der tatsächliche 
Dynamikzustand S,ef dargestellt. Entsprechend der Übergangsmatrix ist der 
häufigste Zustand der mittlere Zustand $; = 3. Sowohl das offline, als auch das 
rekursive Verfahren ermitteln diesen weitgehend zutreffend. Ebenso werden 
die meisten dynamischen Wechsel des Zustands S,ef erfasst. Einige der Zu- 
standswechsel können vor allem in der zweiten Hälfte der Fahrt nicht erfasst 
werden (z.B. t ~ 1200s). Dies ist auf die mangelnde Beobachtbarkeit bzw. 
fehlende Abbildung der gewünschten bzw. vom Fahrer tolerierten Fahrdynamik 
in den Messgrößen (z.B. Konstantfahrt ohne Kurven) zurückzuführen. Abb. 
3.24 zeigt die gefahrene Geschwindigkeit und Längs- und Querbeschleunigun- 
gen (betragsmäßig) sowie die theoretischen Grenzwerte der Beschleunigungen 
durch den Fahrerwunschdynamik-Zustand S,.; für den betreffenden Zeitaus- 
schnitt. Die Darstellung zeigt, dass manche Wechsel des Fahrerzustandes nicht 
in den Messgrößen sichtbar werden, da sie in einer solchen Konstantfahrphasen 
auftreten. 


Die Schätzwerte der Übergangsmatrix sind in Abb. 3.25 dargestellt. Die ge- 
schätzten Übergangsmatrizen weisen die gleiche Charakteristiken auf wie die 
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Abb. 3.23: Zustandswahrscheinlichkeiten 7, zum Zeitpunkt ¢ und echter Zustand der Fahrerwun- 
schdynamik Sef (t) für Testdaten erzeugt mit der Beispiel-Zustandsiibergangsmatrix Ma. Ermittelt 
mit einer Schätzung der Zustandsiibergangsmatrix M nach fünf Iterationen des Baum-Welch- 
Algorithmus (a) und rekursiv mit Online EM (b). 


zugrundeliegende Matrix M2 (a) mit geringfügigen Unterschieden zwischen 
der Baum-Welch-Schätzung (b) und der Online-EM-Schätzung (c). Die Schätz- 
werte und Zustandswahrscheinlichkeiten für die übrigen Fahrertypen sind in 
Anhang A.7 aufgeführt. 


Die Beispiele zeigen, dass die Parameterschätzungen mittels Baum-Welch- 
Algorithmus und Online-EM vergleichbare Resultate liefern und die rekursive 
Variante keine relevanten Einschränkungen hinsichtlich der Schätzgenauig- 
keit im Vergleich zur Offline-Berechnung hat. Der aktuelle Zustand sowie die 
Charakteristik der Übergangsmatrix können — die Beobachtbarkeit vorausge- 
setzt — sowohl mittels Baum-Welch als auch mittels Online-EM mit hoher 
Zuverlässigkeit ermittelt werden. 
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Abb. 3.24: Geschwindigkeit v, betragsmäßige Längsbeschleunigung a, und betragsmäßige Querbe- 
schleunigung ay sowie die zugehörigen theoretischen Grenzwerte a, max und dy max des zugehörigen 


Fahrerwunschdynamik-Zustands S,ef(t) zum Zeitpunkt t. 


Zusammenfassend zeigen die simulativen Testfahrten, dass die Identifikation 
der stochastischen Prozessparameter (unter Ausnahme von @) mit rekursi- 
ven Verfahren möglich ist. Einschränkungen bezüglich der Schätzgenauigkeit 
bestehen hauptsächlich durch eingeschränkte Beobachtbarkeit der zugrundelie- 
genden Zielgrößen. Für den Autokorrelationsparameter @ muss eine geeignete 
Annahme getroffen werden, da die eingeschränkte Beobachtbarkeit hier zu 


einer unzureichenden Schätzgenauigkeit führt. 
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(a) (b) (c) 


Abb. 3.25: Referenz-Zustandsübergangsmatrix Mp (a) und die Schätzungen M nach fünf Iterationen 
des Baum-Welch-Algorithmus (b) und rekursiv mit Online-EM (c). Ubergangswahrscheinlichkeiten 
Pij = P(Si41 = JS: =). 


3.6.3 Ergebnisse der Testfahrten 


Nachdem die Parameterschätzung mit simulativen Daten verifiziert wurde, wer- 
den in diesem Abschnitt die Prozessparameter der Realfahrten analysiert. Die 
Prozessparameter werden mit den vorherig beschriebenen rekursiven Verfahren 
ermittelt. 


Abb. 3.26(a) zeigt die geschätzten Parameter des Geschwindigkeitsprozesses. 
Mit wenigen Ausnahmen bewegt sich die mittlere Geschwindigkeitsabwei- 
chung [la in einem engen Bereich um 0 m/s mit einem Median von —0.26 
m/s. Der Median der Streuung der Geschwindigkeitsabweichung oy liegt bei 
2.77 m/s. Die Streuung Oe liegt etwas höher mit einem Median von 4.03 m/s. 
Der Autokorrelationsparameter @ wurde entsprechend der, in einem späteren 
Abschnitt ermittelten, Annahme @, gewählt (siehe hierzu Abschnitt 3.8.2). Abb. 
3.26(b) zeigt die stationäre Verteilung m der Fahrerwunschdynamik-Zustände 
SÍ für alle Fahrer, entsprechend der identifizierten Ubergangsmatrizen M. Die 
stationäre Verteilung 7. entspricht der erwarteten Häufigkeitsverteilung der 
Zustände über einen längeren Zeitraum. Diese Verteilungen zeigen hier un- 
terschiedliche ermittelte Charakteristiken für die Fahrer. Während für einige 
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Abb. 3.26: Rekursiv identifizierte Prozessparameter am Ende einer Testfahrt für alle neun Test- 
fahrten: Parameter UA, OA, Oe des Geschwindigkeitsverhaltens (a) und die erwarteten mittleren 
Häufigkeiten T der Fahrerwunschdynamik-Zustände (stationäre Zustandsverteilungen des HMM) 


(b). 


Fahrer durchgängig moderate (z.B. Fahrer 2 und 3) oder dynamische (Fahrer 
9) Fahrerwunschdynamik-Zustände identifiziert werden, treten bei anderen 
Fahrten eine große Bandbreite von Dynamikzuständen auf (z.B. Fahrer 4 und 
5). Dies verdeutlicht, dass mit zeitlichen Änderungen im Fahrerverhalten hin- 
sichtlich der Wunschdynamik zu rechnen ist. 


Zusammenfassend zeigt sich ein ähnliches mittleres Verhalten der Fahrer hin- 
sichtlich der Geschwindigkeit, wobei bei allen Fahrern eine signifikante Streu- 
ung vorliegt. Bezüglich des Fahrstils bzw. der Fahrerwunschdynamik zeigen 
die Fahrer ein sehr unterschiedliches Verhalten. 


3.7 Erzeugung stochastischer Vorhersagen 


Mit der Transferfunktion fr aus Abschnitt 3.5.1 und den geschätzten Parame- 
tern ® und 0 kann eine Vorhersage der Fahrzeugdynamik y berechnet werden: 


Sa = fr (97,57, %, Tpso) -'? (3.65) 


12 Da im Folgenden zwischen dem fortlaufenden Zeitindex t und dem Zeitindex der Vorhersage 
bezogen auf den Zeitpunkt 7 unterschieden werden muss, wird f als Zeitindex der Vorhersage 
verwendet. f = 10 bezieht sich damit auf eine Vorhersage für den Zeitpunkt t +f = t + 10 und 
?=0 ist der Zeitpunkt r selbst. 
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Da die Parameter der Transferfunktion durch einen stochastischen Prozess 
Y~ (6) beschrieben werden, kann durch selbigen Prozess eine stochasti- 
sche Vorhersage der Fahrzeugdynamik y erfolgen. Um diese Vorhersage zu 
berechnen muss die aus der Prozessbeschreibung folgende Verteilung im Para- 
meterraum von y mit der Transferfunktion in die resultierende Verteilung der 
Fahrzeugdynamik y transformiert werden. 


Da die Transferfunktion eine nicht-lineare Funktion ist und die Unsicherhei- 
ten nicht aus rein additiven Gauß’schen Verteilungen bestehen, kann diese 
Transformation nicht analytisch durchgeführt werden. Um die resultierende 
Verteilung Y; zu berechnen, muss daher auf Monte-Carlo Verfahren zurückge- 
griffen werden. 


3.7.1 Monte-Carlo-Sampling und -Approximation 


Die Idee des Monte-Carlo-Sampling ist, Eigenschaften einer Größe von In- 
teresse und ihrer Verteilungsfunktion durch das Ziehen zufälliger Samples zu 
ermitteln. Sei also 


Ye ={51,...,Ix} (3.66) 


eine Menge von K Samples der Verteilung Y, dann kann Yx als Approximation 
fiir die Verteilung Y verwendet werden. Die Dichtefunktion kann als Summe 
von Delta-Distributionen 


K 
fig 0) = È Pe SO), (3.67) 
k=l 
mit Partikeln der Masse p an den Position y; dargestellt werden. Im Normalfall 


sind die Partikel gleichgewichtet (p = $). Die kumulierte Dichtefunktion der 
Vorhersagegröße yg < R! kann dann mit 


K 
Fy, (y) zZ L pr 1,0) ? 
k=1 


1 fall b en 
alls a > 
1,(a) = | = 


0 sonst 
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angegeben werden. Der Erwartungswert der Vorhersage bzw. einer Funktion 
der Vorhersage berechnet sich mit 


K 
(x) = È prô, 
y (3.69) 
(f(¥x)) = È pe Fx) 
k=1 


Da das Monte-Carlo-Sampling in diesem Fall zur Approximation einer analy- 
tisch nicht zu berechnenden Verteilung verwendet wird, wird auch von Monte- 
Carlo-Approximation gesprochen. Siehe beispielsweise (Lem09) fiir eine aus- 
führliche Behandlung von Monte-Carlo-Sampling. 


Berechnung der Monte-Carlo-Approximation: 
Im Folgenden wird die Berechnung einer f-Schritte-Monte-Carlo- Vorhersage 
der Fahrzeugdynamik Y; x geschildert. 


Zunächst werden X Samples für den Parametervektor ¥ gezogen. Dieses ziehen 
der Parameter-Samples wird alle c; r Zeitschritte wiederholt. Dabei folgen die 
Parameter von y der entsprechenden Prozessbeschreibung I’ aus Abschnitt 3.5.2. 
Fiir die Zielgeschwindigkeit gilt (Sample-Index k in folgenden Gleichungen 
zur einfacheren Lesbarkeit vernachlässigt): 


VZF+1 = Vue+i + VARF (3.70) 


mit 
varri = (1—&)(Ovarz +e), EN (0,62) 
Yu = 670% + (1 — vun Or ~ Vz (3.71) 


Vu,0 = Vz >VAR0 =9 


mit 6; entsprechend Gl. (3.23). Der Fahrerwunschdynamik-Zustand 57 folgt der 
Markov-Ketten-Beschreibung mit 


Sri ~ P(Sr+1|Sr) 5 


3.72 
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Die Fahrerwunschdynamik-Parameter y4 ergeben sich entsprechend aus dem 
Markov-Zustand mit 


Yat+1 = fd Sma - (3.73) 
Siehe hierzu Tabelle 3.2. 


Das Zielsegment szp wird entsprechend der Segmentwahrscheinlichkeiten 
gezogen, siehe hierzu Gl. (3.17) bzw. Gl. (3.18). 


Mit dem so erhaltenen Vektor ¥;; Können die resultierenden Samples yz x der 
Fahrzeugdynamik berechnet werden. Dementsprechend formuliert sich die 
Berechnung der Vorhersage zu 
Vi € [0,T],Vk € [1,K]: 
Derik = fr Sek STk Wek TpsD) » 
7 hyre ~he Â) falls F=k-or,keN 
+1,k 
i Viti k = Vrk sonst 


(3.74) 


’ 


mit o initialisiert auf den aktuellen Ist-Zustand der Fahrzeugdynamikgrößen 


Yor=)t: (3.75) 


Abb. 3.27 zeigt eine beispielhafte Vorhersage Yex fiir K = 10 fiir die Stre- 
ckensituation entsprechend Abb. 3.3 und exemplarische Prozessparameter 0. 


Der benötigte Rechenaufwand zur Erzeugung der Vorhersage hängt dabei von 
der Anzahl an Samples X und dem Vorhersagehorizont 7 ab. Der Vorher- 
sagehorizont T ist außerdem von der Länge des verfügbaren elektronischen 
Horizonts abhängig. Im Folgenden wird der Vorhersagehorizont T = 30s ge- 
wählt, da dieser Horizont bei der gegebenen Datenlage in fast allen Fällen durch 
den elektronischen Horizont abgedeckt ist und als sinnvoller Kompromiss aus 
verfügbaren Daten und benötigtem Rechenaufwand betrachtet werden kann. 
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ây [m/s*] 


Abb. 3.27: Beispielhafte Monte-Carlo-Vorhersagen ¥; x der Fahrzeugdynamikgrößen (Geschwin- 
digkeit v, Längsbeschleunigung a,, Querbeschleunigung a, und Radleistung Pr) mit K = 10 
Samples für einen Vorhersagezeithorizont T von 30 Sekunden. 


3.7.2 Konvergenz und Varianz 


Der Vorteil einer Monte-Carlo-Approximation ist, dass die Verteilungen Y; 
für jede beliebige nicht-lineare Transformation sowie beliebige stochastische 
Prozesseinflüsse approximiert werden können. Nachteilig ist der offensicht- 
lich von der Sample-Größe K abhängige Rechenaufwand sowie das nicht- 
deterministische Verhalten der Vorhersage. Daher stellt sich die Frage nach der 
Genauigkeit der Approximation abhängig von der Anzahl an Samples X sowie 
des Zufallseinflusses durch das Monte-Carlo-Sampling. Diese Einflüsse sollen 
im Folgenden analysiert werden. 


Die mit Monte-Carlo-Sampling approximierte Verteilung konvergiert fast si- 
cher für K — oo (Lem09). Die Anforderungen an geringen Rechenaufwand 
schränken den möglichen Wertebereich für K aber auf relativ kleine Werte 
ein (z.B. K < 20). Es ist somit zu untersuchen, wie groß die Diskrepanz zwi- 
schen aufeinander folgenden Vorhersagen bzw. einer Vorhersage und einer fast 
sicher konvergierten Verteilung ist. Für diese Untersuchungen wird zunächst 
ein Abstandsmaß für zwei Vorhersagen aa benötigt. Ein häufig verwende- 
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tes Abstandsmaß für zwei Wahrscheinlichkeitsverteilungen P und Q ist die 
Wasserstein-Distanz W, der Ordnung p für die Metrik p 


W,(P,Q) = YinfE[p(3,n)P], (3.76) 


wobei inf!? über alle Permutationen möglicher Paare der Zufallsvariablen € 
und 7) mit Verteilungen P und Q ermittelt wird (Vil09). Für die euklidische 
Metrik und x € R! kann die Wasserstein-Distanz auch als Integral 


oo p 


WPO) = | | IF@ -60 dx 3.77) 


mit den Verteilungsfunktionen F und G der Verteilungen P und O geschrieben 
werden (Val74). Die Wasserstein-Distanz wird in Computerwissenschaften 
auch als „Earth Mover’s Distance“ bezeichnet (vgl. (RTO1)), da sie die Lösung 
des optimalen Transportproblems zur Verschiebung der Verteilung P in die 
Verteilung Q bzw. umgekehrt ist (Vil09). Eine Methode zur Berechnung von 
W, für zwei Samplevorhersagen Ye wird in Anhang A.8 beschrieben. Die 
Wasserstein-Distanz kann in der Einheit der Vorhersagegröße berichtet werden. 


Zur Untersuchung der Diskrepanz zwischen unterschiedlichen Vorhersagen 
mit gleichen Parametern und des Konvergenzverhaltens der Monte-Carlo- 
Approximation fiir wachsende K wird eine Referenzvorhersage Ê; 500 mit 
K = 500 Samples für die Beispielsituation aus Abb. 3.3 durchgeführt. Anschlie- 
Bend werden die Samplegröße variiert (K € [1, 100]) und je 10 Vorhersagen 
bei konstanter Samplegröße berechent. Da die Beispielsituation aus mehreren 
Routenoptionen mit Autobahn- und Landstraßenanteil besteht, wird hier eine 
große Varianz in der Verteilungsvorhersage erwartet. Diese Streckensituation 
eignet sich daher für Referenzuntersuchungen. 


Unter Wasserstein-Distanz wird im Folgenden zur einfacheren Referenzie- 
rung der Mittelwert der Wasserstein-Distanz über alle Vorhersagehorizonte 


13 inf=Infimum: Größte untere Schranke. 
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Abb. 3.28: Referenz-Vorhersage Ê 500 mit K = 500 Samples. Aus Griinden der Darstellbarkeit sind 
nur 100 Samples abgebildet. 


(t € [1,T]) verstanden. Zur Bewertung der Konvergenz wird die Wasserstein- 
Distanz erster Ordnung von der Referenzvorhersage mit 


ies xs 
Wi ref = T yw (Y; K, Y; 500) (3.78) 
j=l 


berechnet. Die Diskrepanz zwischen zwei Vorhersagen mit gleicher Sample- 
größe K wird durch die Wasserstein-Distanz der Vorhersagen untereinander 
mit 


Wc = = MEN) itj (3.79) 


bewertet, wobei 7) und pH ) zwei unterschiedliche Vorhersagen mit gleicher 


Sample-Größe sind. Für die Distanzen Wi ref und Wi g werden die Mittel- 
werte und Standardabweichungen über alle Vorhersagen einer Sample-Größe 
ausgewertet, folgend als E(-) und o(-) notiert. 


Abb. 3.29 zeigt das Konvergenzverhalten (a) und die Distanz zwischen ein- 
zelnen Vorhersagen (b) beispielhaft für die Vorhersage der Geschwindigkeit. 
Der Abstand zur Referenzverteilung Wı ef verringert sich sukzessive mit 


zunehmender Anzahl an Samples und verdeutlicht die Konvergenz für große 
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1 50 100 1 50 100 
K K 
(a) (b) 


Abb. 3.29: Bewertung der Vorhersage ? der Geschwindigkeit abhängig von der Anzahl an Samples 
K. (a) Konvergenz: Mittelwert E(Wı,rer) und Standardabweichung o (W1 ref) der Wasserstein- 
Distanz von 10 Vorhersagen mit X Samples zur Referenzvorhersage mit 500 Samples. (b) Diskre- 
panz: Mittelwert und Standardabweichung der Wasserstein-Distanz zwischen den 10 Vorhersagen 
mit K Samples. 


Sample-Größen K. Der mittlere Abstand E(Wı re f) sinkt dabei von ca. 7 m/s 
bei K = 1 auf weniger als 1 m/s bei K = 100. Die Standardabweichung des 
Abstandes o (W1 ef) ist unabhängig von der Anzahl an Samples gering. Die 
mittlere Distanz E(Wı x) zwischen den Vorhersagen bei gleicher Sample-Größe 
ist unabhängig von der Sample-Größe K gering (kleiner 1 m/s). Diese Distanz 
weist dabei eine größere Streuung für K < 10 auf. 


Im Mittel unterscheiden sich zwei Vorhersagen somit nur geringfügig und 
der Abstand zur Referenzverteilung sinkt mit wachsender Sample-Größe K. 
Für geringere Sample-Größen (K < 10) treten dabei größere Streuungen des 
Abstands zwischen Vorhersagen bei gleicher Sample-Größe auf. Wird K > 10 
gewählt, ist der Zufallseinfluss beim Erzeugen der Vorhersage somit vernach- 
lässigbar gegenüber dem Abstand zur Referenzverteilung. Dieser nimmt für 
die Geschwindigkeitsvorhersagen linear mit zunehmender Anzahl an Samples 
ab. Die übrigen Vorhersagegrößen weisen vergleichbare Charakteristiken auf. 
Siehe hierzu Anhang A.9. 
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3.8 Validierung des Vorhersagemodells 


In den vorhergehenden Abschnitten wurde das Schätzen von Prozessparametern 
und das Erzeugen von stochastischen Vorhersagen für das vorgeschlagene 
Vorhersagemodell behandelt. In diesem Abschnitt erfolgt die Validierung und 
Bewertung des Vorhersagemodells mit den realen Testfahrten (siehe hierzu 
auch Abschnitt 3.4). 


3.8.1 Bewertungsgrößen 


Bevor eine Analyse der Vorhersagegüte erfolgen kann, müssen geeignete Be- 
wertungsgrößen definiert werden. Wie bereits in Abschnitt 2.3.2 diskutiert ist 
die Bewertung von Vorhersagen ein häufig unzureichend behandeltes Thema 
(siehe z.B. (Gnell)). 


In den letzten Jahren hat sich in der Wissenschaft der Konsens gebildet, dass sto- 
chastische Vorhersagen hinsichtlich des Paradigmas ,,maximizing the sharpness 
[...] subject to calibration“ (GBR07, S. 243) bewertet werden sollten. Dabei 
bezieht sich Kalibrierung auf die statistische Konsistenz zwischen den Vertei- 
lungsvorhersagen und den Beobachtungen. Die Schärfe bezieht sich auf die 
Konzentration der Verteilungsvorhersage. Eine kombinierte Bewertung von 
calibration und sharpness kann durch Proper Scoring Rules erfolgen. Dabei 
wird die Vorhersageverteilung Y basierend auf einer Realisierung y bewertet. 
Der Score einer Realisierung wird als s(Ŷ,y) geschrieben. „Proper“ bezieht sich 
dabei auf die Eigenschaft, dass der Erwartungswert von s(Y,y) maximal wird, 
wenn y aus der Verteilung Y stammt. Diese Bewertungsregeln erfordern „auf- 
richtige“ Vorhersagen, da sich sowohl eine Über- als auch eine Unterschätzung 
der Unsicherheit negativ auf die Bewertung auswirkt. (GBRO7, GRO7) 
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Eine häufig verwendete Bewertungsregel fiir Sample-Vorhersagen ist der contin- 
ous ranked probability score (CRPS). In seiner negativen Orientierung, definiert 
sich dieser mit der Verteilungsfunktion der Vorhersage als 


crps(?,y) = | a) -P ae, 
> (3.80) 


1 fallsx >y 
0 sonst Á 


wobei Fọ die Verteilungsfunktion der Vorhersage Y ist. !* Eine alternative 
Darstellung des CRPS ist durch 


1 
CRPS(F,y) = (X —a|)— 5 z (IX —X"|) , (3.81) 


gegeben, wobei X und X’ unabhingig Realisierungen von Zufallsvariablen mit 
Verteilungsfunktion Fy sind. (GRO7) 


Für eine Sample-Vorhersage Yx = {94} ke [1K] mit Gewichtungen px und der 
Realisierung y ermittelt sich der CRPS mit 


1 KK 
5 L Pepe li Sul 8:82) 


K 
CRPS(¥x,y) = Y pr ISk- y|- 
k=l k=1K=1 


(GGBJ06) 


In der angegebenen negativen Orientierung kann der CRPS in der Einheit der 
Vorhersagegröße angegeben werden und ist die Generalisierung des absoluten 
Fehlers auf Verteilungsvorhersagen. Für eine Punktvorhersage reduziert sich 
der mittlere CRPS, folgend als MCRPS bezeichnet, auf den mittleren absolu- 
ten Fehler (MAE - mean average error). Der MCRPS kann somit auch zum 
Vergleich von Punkt- und Verteilungsvorhersagen eingesetzt werden, da er für 
beide Vorhersagen gleichermaßen berechnet werden kann. (GRO7) 


14 Der Vergleich von GI. (3.80) und Gl. (3.77) zeigt, dass der continous ranked probability score 
verwandt mit der Wasserstein-Distanz 2. Ordnung zwischen der Vorhersage und der Punktreali- 
sierung ist. 
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Der CRPS wird für einen Vorhersagehorizont f als Mittelwert über alle Zeit- 
punkte einer Fahrt (MCRPS7) und als totaler Mittelwert über alle Vorhersage- 
horizonte ermittelt (MCRPS): 


1 
MCRPS; = Tey] CRP SF 9147) > 
i (3.83) 


1 
MCRPS = —— }_ MCRPS; . 


12317 


Als zusätzliche Bewertungsgröße wird der Energy Score (ES) verwendet. Der 
Energy Score ist eine Generalisierung des CRPS und ist in ebenfalls negativer 
Orientierung als 


ES(F,y) = a (|x x/) SE (Ix x) (3.84) 


mit ß € (0,2) definiert. Für den Grenzfall $ = 2 ist diese Scoring Rule zwar 
nicht mehr streng „proper“, aber immernoch ,,proper“ und generalisiert den 
mittleren quadratischen Fehler (MSE - mean squared error) auf Verteilungen. 
(GRO7) 

Folgend wird der Energy Score für den Grenzfall B = 2 als Ergänzung zum 
CRPS verwendet. Die Berechnung kann in diesem Fall durch 


K K 


K 
1 
ES(,y)= pe bay — 5 D Pe Pe bay? (68.85) 
k= k=1k/=1 


erfolgen. Da der mittlere Energy Score (MES) für B = 2 als Generalisierung 
des MSE interpretiert werden kann, wird im Folgenden seine Wurzel (RMES - 
Root Mean Energy Score) entsprechend des RMSE (Root Mean Square Error) 
angegeben: 

RMES = VMES . (3.86) 


Der RMES kann ebenfalls in der Einheit der Vorhersagegröße angegeben 
werden. Der RMES wird entsprechend für einen Vorhersagehorizont 7 als 


90 


3.8 Validierung des Vorhersagemodells 


Mittelwert über alle Zeitpunkte einer Fahrt (RME‘S;) und als totaler Mittelwert 
über alle Vorhersagehorizonte ermittelt (RMES): 


1 
RMES; = Vien! VES (Fy, 9147) > 
(3.87) 


RMES = —— ) RMES; 
Ta EAMES. 


Die Schärfe bzw. Konzentration der Vorhersagen kann zusätzlich über die 
Breite der zentralen Vorhersageintervalle analysiert werden. Hierfür wird die 
Breite B, des zentralen Vorhersageintervalls p mit 


By =F, \(05+5)—Fy (05-5) (3.88) 


ermittelt, wobei Fy ! die Inverse der Verteilungsfunktion der Vorhersage ist. 


3.8.2 Einflussanalyse 
Autoregressionsparameter o 


Wie in Abschnitt 3.6.2 beschrieben, kann die Autokorrelation @ des AR(1)- 

Modells der Zielgeschwindigkeit aufgrund der Charakteristik der Ubertra- 
gungsfunktion nicht zuverlässig ermittelt werden. Um zu untersuchen, ob das 
zeitliche Verhalten eher einem korrelierten oder unkorrelierten Prozess folgt, 
werden Vorhersagen mit unterschiedlichen Annahmen für @ verglichen. Zur 
Analyse des Einflusses wird daher die Vorhersage mit einem festen Schätzwert 
$. der Autokorrelation (d = $.) mit der Vorhersage mit der CML-Schätzung 
Ô = Ocuz verglichen. Der feste Schätzwert @. wird zwischen 0 und 0.9 variiert. 
Die Route wird für die Berechnung der Vorhersagen als bekannt angenom- 
men. Die Parameter Ô werden mit einem Durchlauf der Fahrt initialisiert. Es 
wird keine Begrenzung des Lernhorizonts vorgenommen (siehe hierzu auch 
Abschnitt 3.8.2). In einem zweiten Durchlauf werden die Vorhersagen berech- 
net und ausgewertet. Die Vorhersagen werden für die Vorhersagehorizonte 
f € [2,5,10,15,20,30] ausgewertet. Die Sample-Größe der Vorhersagen wird 
als X = 10 gewählt. 
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Abbildung 3.30 zeigt den MCRPS und RMES der Geschwindigkeit gemittelt 
über alle Fahrten und Zeithorizonte. Die mittlere Abweichung (MCRPS) und 
mittlere quadratische Abweichung (RMES) ist für die unkorrelierte Zeitreihe 
(e = 0) am geringsten. Die Fehlermaße steigen mit größerem d. geringfügig 
an. Bei Verwendung der CML-Schätzung Êcmz zeigen sich ähnliche Fehler- 
werte wie bei Annahme einer (festen) hohen Autokorrelation. Dies ist nicht 
verwunderlich, da die beobachtbare Zeitreihe immer zur Schätzung einer hohen 
Autokorrelation führt (siehe auch Abschnitt 3.6.2). 


+— o=¢ $ = deu 
MCRPS RMES 

2.5 4.1 
w 2.4 m 
> > 
3 | 3 al aw | 
Ko 2.3 <> 

2.2 3.9 

0 0.5 0.9 0 0.5 0.9 
Pe Pc 


Abb. 3.30: Mittlere Abweichung (MCRPS) und mittlere quadratische Abweichung (RMES) der 
Geschwindigkeitsvorhersage Ŷ über alle Fahrten für unterschiedliche Konstantwerte @ = d. (blau) 


und den CML-Schätzwert N = cmu (rot). 


Abb. 3.31: Uber alle Fahrten ermittelte mittlere Breite By 5 des 50%-Vorhersageintervalls der 
Geschwindigkeit v für den Vorhersagehorizont ? bei festen AR-Koeffizienten @, = 0 und @ = 0,9. 
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Der Unterschied in der Vorhersage zwischen einer korrelierten und unkor- 
relierten Zeitreihe lässt sich gut an der Entwicklung der Breite des 50%- 
Vorhersageintervalls über den Vorhersagehorizont darstellen. Wie Abb. 3.31 
zeigt, nimmt für die unkorrelierte Vorhersage die Streuung schneller zu, bleibt 
aber für einen größeren Zeithorizont geringer als bei der korrelierten Zeitreihe. 
Entsprechend der Bewertungsgrößen folgen die realen Daten eher dem Ver- 
halten der unkorrelierten Zeitreihe. Im Folgenden wird daher die konstante 
Annahme ĝ = 0 verwendet. 


Lernhorizont 


Ein weiterer Parameter des Vorhersagemodells, dessen Einfluss untersucht 
werden soll, ist der Lernhorizont der rekursiven Parameterschätzverfahren. Die 
rekursiven Schätzgrößen haben i. A. eine Form 


x A-1l, 1 

0, (X1:n) = T On—1 (X1:n-1) + ane > (3.89) 
wobei 6, die Schätzung des Parameters 0 nach n Beobachtungen ist und x, die 
n-te Beobachtung. Der Gewichtungsparameter A ist definiert durch 


A = min (n, nmax) (3.90) 


mit dem n„ay-schrittigen Lernhorizont. Der zeitliche Lernhorizont für die 
Prozessparameter ergibt sich dann mit der Zeitschrittkonstante c, r und der 
Zeitdiskretisierung Ar zu 


tin = nmax’ Ctr’ Ar. (3.91) 


Um den Einfluss des Lernhorizonts zu bewerten, werden Vorhersagen mit un- 
terschiedlicher Konfiguration durchgeführt. Dabei wird eine Testfahrt jeweils 
fünfmal wiederholt und die Vorhersagen der ersten und letzten Fahrt bewertet. 
Die Parameter werden mit den in Abschnitt 3.6.1 definierten Werten initialisiert. 
Dabei werden Lernhorizonte tı, von 5 und 30 Minuten mit einem unbegrenz- 
ten Lernhorizont (tın = ©) verglichen. Die Vorhersagen werden mit K = 10 
Samples berechnet. 


93 


3 Vorhersage der Fahrzeugdynamik 


Abb. 3.32 zeigt die mittlere Performance der Vorhersagen im ersten und fünf- 
ten Durchlauf einer Fahrt, normiert auf das Resultat ohne Beschränkung des 
Lernhorizonts im ersten Lauf. Erwartungsgemäß fallen die Bewertungsgrö- 


—k— tn =5 min —#— tn =30 min —=— t =o 


MCRPS 


ae 
l SY li =! T! 
© Š S a 
0.95 0.95 0.95 0.95 


l Lauf 5 l Lauf 5 l Lauf 5 ! Lauf 5 
(a) 
RMES 
ae = 
| = = 
0.95 0.95 
l Lauf 5 ı Lauf 5 ı Lauf 5 l Lauf 5 
(b) 


Abb. 3.32: Mittlere Abweichung (MCRPS) (a) und mittlere quadratische Abweichung (RMES) (b) 
der Vorhersagen für die Fahrzeugdynamik (v, ax, ay, Pr) für die Lernhorizonte tın. Dargestellt für 
die Durchläufe 1 und 5 bei X = 10 Samples, normiert auf das Resultat ohne Beschränkung des 
Lernhorizonts im ersten Lauf. 


Ben im fünften Lauf besser aus. Dabei zeigen sich ähnliche Resultate für den 
Lernhorizont von 30 Minuten und den unbegrenzten Lernhorizont. Mit 5 Mi- 
nuten Lernhorizont fallen die Ergebnisse durchgängig am schlechtesten aus. 
Folglich eignet sich ein zu kurzer Lernhorizont nicht, um die stochastischen 
Eigenschaften geeignet zu erfassen. Für die nachfolgenden Auswertungen wird 
der Lernhorizont daher nicht begrenzt. 
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3.8.3 Referenzmodelle 


Die erzielbare Vorhersagegüte ist im Allgemeinen unbekannt und hängt von der 
Unsicherheit des zugrundeliegenden Prozesses ab. Eine absolute Bewertung 
einer erzielten Vorhersagegüte ist daher nur eingeschränkt möglich. Um die 
erzielten Vorhersagegüten in Relation zu setzen, werden daher andere Vorher- 
sagemodelle als Referenz verwendet. Der Vergleich der Vorhersagemodelle 
kann zur Analyse und Ableitung individueller Stärken und Schwächen der 
Vorhersagemodelle eingesetzt werden. 


Ein in der Literatur häufig verwendetes Modell, das ohne den Einsatz von 
Streckendaten auskommt, sind Markov-Ketten in der Dimension der Vorher- 
sagegröße (siehe Abschnitt 3.2.2). Da Markov-Ketten üblicherweise ebenfalls 
zur Erzeugung von Sample-Vorhersagen eingesetzt werden, können diese als 
stochastisches Referenzmodell für das in dieser Arbeit vorgestellte Verfahren 
verwendet werden. Um weiterhin den Einfluss der Berücksichtigung der Unsi- 
cherheit zu untersuchen, soll als zweite Referenz eine deterministische Punkt- 
vorhersage erzeugt werden. Um einen direkten Vergleich der stochastischen 
Vorhersage und der Punktvorhersage zu ermöglichen, wird die Punktvorher- 
sage ebenfalls mit der selben Transferfunktion erzeugt. Die Erzeugung dieser 
Referenzvorhersagen wird im Folgenden skizziert. 


Markov-Ketten-Vorhersage 


Markov-Ketten wurden in der Literatur häufig zur Vorhersage von Fahrzeug- 
dynamikgrößen eingesetzt (siehe z.B. (LPG04, KF09, BRD*+10, RBD*10, 
MFCS11, DBBK14)). Dabei wird der zulässige Wertebereich der Vorhersage- 
größe in M Wertebereiche w; aufgeteilt. Jeder Wertebereich w; repräsentiert 
einen Markov-Zustand S; = i. Da die Markov-Kette im Gegensatz zum HMM 
beobachtbar ist, können die Übergangswahrscheinlichkeiten der Zustände di- 
rekt ermittelt werden (vgl. (DBBK14)). Diese Rekursionsgleichung hat für die 
Übergangswahrscheinlichkeit p;; = P(S; = j|S;-1 = i) nach n-Schritten die 
Form 
A;-1 1 


Pijn = =z Pijn + TA j (3.92) 
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mit 
Ài = mMin (Ni n, Nmax) ’ 


M 
Nin =Nin-1 +) Oi 
L : (3.93) 
t falls Sn = j,Sp_1 =i 
6ij = 1 
0 sonst 


Nin ist dabei die Anzahl an Transitionen, die den Zustand i verlassen und 
A; der bereits bekannte rekursive Gewichtungsparameter. 6;; gibt die aufge- 
tretene Transition an. Die Wahl der Anzahl an Markov-Zuständen wird an 
(BRD*10, RBD*10, DBBK14) angelehnt, allerdings werden M = 17 statt 
16 Zustände verwendet, um eine symmetrische Verteilung um den mittle- 
ren Zustand für die Größen Längs- und Querbeschleunigung zu ermöglichen. 
Theoretisch könnte ein mehrdimensionale Markov-Kette erzeugt werden, in- 
dem die kombinierten Übergänge aller vier Dimensionen der Vorhersagegröße 
berücksichtigt werden. Da dies jedoch in einer sehr großen Anzahl an Über- 
gangswahrscheinlichkeiten (17* > 8 - 10*) resultieren würde und in der re- 
ferenzierten Literatur ebenfalls nicht erfolgt, wird für jede Vorhersagegröße 
(V, dx, dy, Pr) jeweils eine Markov-Kette trainiert. Ausgehend vom aktuellen 
Zustand (Wertebereich) der Markov-Kette, kann die Sample-Vorhersage direkt 
aus den Übergangswahrscheinlichkeiten realisiert werden. 


Abb. 3.33 zeigt eine beispielhafte Vorhersage der Geschwindigkeit mit einer 
Markov-Kette mit 10 Samples. Die Hintergrundfarben markieren dabei die 
Wertebereiche der einzelnen Markov-Zustände. Den Samples wird jeweils der 
mittlere Wert des zugehörigen Zustands zugeordnet. Es können daher nicht alle 
10 Samples unterschieden werden. 


Punktvorhersage 


Für die Punktvorhersage des vorgestellten Modells wird eine Vorhersage mit 
den wahrscheinlichsten Werten der Parameter y erzeugt. Für den Fahrerwunsch- 
dynamik-Zustand bedeutet das in der Regel das Beibehalten des gegenwär- 
tig wahrscheinlichsten Zustands. Da der Erwartungswert des autoregressiven 
Prozesses null ist, wird dieser bei der Punktvorhersage entsprechend nicht 
berücksichtigt. Die Zielgeschwindigkeit bleibt somit konstant für das aktuelle 
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Abb. 3.33: Sample-Vorhersage (10 Samples) der Geschwindigkeit v erzeugt mit einer Markov-Kette. 
Die Hintergrundfarben markieren die Wertebereiche der einzelnen Markov-Zustände. 


Geschwindigkeitslimit bzw. beim Mittelwert der Verteilung Vz. Die Vorhersage 
entspricht damit einer berechneten Trajektorie der Transferfunktion mit festen 
Parametern, ähnlich dem Beispiel in Abb. 3.7. 


Zur Referenzierung werden die Modelle wie folgt bezeichnet: 


SPnc: Monte-Carlo-Vorhersage mit dem vorgestellten stochastischen Prozess- 
modell I’ und der Transferfunktion fr. 

SP,: Punktvorhersage mit der Transferfunktion fr. 

MK: Monte-Carlo-Vorhersage mit einer Markov-Kette in der Dimension der 
Vorhersagegröße. 


3.8.4 Ergebnisse mit Realfahrdaten 


Zur Validierung und Bewertung der Vorhersagemodelle werden diese mit den 
durchgeführten Testfahrten evaluiert. Dabei werden die Vorhersagen unter 
unterschiedlichen Randbedingungen ausgewertet. 


Bekannte Strecke 


In der ersten Untersuchung wird von einer bekannten Strecke ausgegangen. 
Um Vergleichbarkeit zu schaffen, werden die Parameter aller Modelle zunächst 


97 


3 Vorhersage der Fahrzeugdynamik 


mit einem Durchlauf einer Testfahrt initialisiert. In einem zweiten Durchlauf 
werden bei fortlaufender rekursiver Schätzung der Parameter die Vorhersagen 
berechnet. Die Strecke wird dabei zunächst als bekannt vorausgesetzt (aktive 
Zielführung). Der Lernhorizont der rekursiven Schätzverfahren wird nicht 
begrenzt. 


Qualitative Analyse: 

Zunächst wird eine qualitative Analyse der Vorhersagen durchgeführt. Abbil- 
dung 3.35 zeigt eine Vorhersage für einen Vorausschauhorizont von T = 30s zu 
einem festen Zeitpunkt = 920s und den tatsächlichen Verlauf der Fahrzeug- 
dynamik. Die Hintergrundfarbe visualisiert die Abweichung (CRPS) zwischen 
Vorhersage und tatsächlichem Wert. Der zugehörige Streckenabschnitt besteht 
aus einer kurvigen Überlandstrecke und ist in Abb. 3.34 abgebildet. 


Nord [m] 


0 200 400 600 800 1000 1200 
Ost [m] 


Abb. 3.34: Zugehöriger Streckenabschnitt (kurvige Überlandstrecke) zu den Vorhersagen aus Abb. 
3:35; 


An diesem Beispiel kann zunächst die Charakteristik der Vorhersagen disku- 
tiert werden. Die Punktvorhersage SP, (b) bildet den Verlauf der tatsächlichen 
Trajektorie vor allem bei der Geschwindigkeit relativ gut ab. Im Detail zeigen 
sich aber Abweichungen z.B. im Geschwindigkeitsniveau bei der Kurven- 
durchfahrt und dem exakten Beschleunigungsverlauf bzw. dem Zeitpunkt des 
Rausbeschleunigens aus der Kurve. Die Monte-Carlo-Approximation SPyc 
(Verteilungsvorhersage) des stochastischen Modells bildet grundsätzlich die 
gleiche Verlaufscharakteristik ab, variiert in der Vorhersage aber den exakten 
Verlauf über die einzelnen Samples der Vorhersage. Die Markov-Kette MK 
kennt keine Streckeninformationen und kann die Kurvendurchfahrt daher nur 
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ungentigend vorhersagen. Sie liefert hier nur die Information tiber die grund- 
sätzliche Charakteristik der einzelnen Größen, liefert aber keine spezifische 
Vorhersage für die Fahrsituation. 


Zur genaueren Analyse werden die 7 Sekunden Vorhersagen Y;(t — F) eines 
Modells mit dem tatsächlichen Verlauf der Vorhersagegröße verglichen. Y;(t—) 
bezeichnet dabei die Vorhersage für f Sekunden, berechnet zum Zeitpunkt t —7 
(Vorhersagen mit konstantem Vorhersagezeithorizont f, zu unterschiedlichen 
Zeitpunkten 7 ermittelt). In Abb. 3.36 sind die Vorhersagen Ê 10(t — 10) und die 
tatsächlichen Verläufe für den Streckenabschnitt aus Abb. 3.35 dargestellt. 


Die Verteilungs- (a) und Punktvorhersage (b) des stochastischen Modells zeigen 
auch in dieser Analyse zunächst ähnliche Verlaufscharakteristiken. Dabei trans- 
portiert die Monte-Carlo-Approximation die Unsicherheit der Größen, während 
die Punktvorhersage nur den Erwartungswert abbildet. Die Verteilungsvorher- 
sage SP,,. weist dabei in Summe etwas geringere Abweichungen auf (CRPS), 
da sie die Unsicherheit und Streuung berücksichtigt. Beide Vorhersagen geben 
die Verlaufscharakteristik der Vorhersagegrößen durch die Information der Stre- 
ckendaten qualitativ gut wieder. Geringfügige Abweichungen, beispielsweise 
durch ein abweichend erwartetes Geschwindigkeitsniveau (t ~ 980s), treten bei 
beiden Vorhersagen auf. Die Markov-Kette zeigt das schon zuvor beschriebene 
Verhalten. Für die Geschwindigkeit konzentriert sich die vorhergesagte Vertei- 
lung um das aktuelle Geschwindigkeitsniveau, charakteristische Manöver wie 
Kurven werden aber nicht vorhergesagt. Dementsprechend treten die größten 
Abweichungen bei den Kurvendurchfahrten auf. Für die übrigen Vorhersa- 
gegrößen transportiert die Markov-Kette bei diesem Vorhersagehorizont nur 
noch unspezifische Informationen. Manövercharakteristiken oder das erwartete 
Niveau von z.B. der Längsbeschleunigung werden kaum wiedergegeben. 


In Anhang A.10 sind die entsprechenden Vorhersagen der Modelle für andere 
Vorhersagehorizonte (f = 2s und f = 20s) abgebildet. Hier zeigt sich, dass die 
Markov-Kette schon fiir einen Vorhersagehorizont von 2s deutlich vom Ist- 
Verlauf abweicht, während beide Vorhersagen mit dem stochastischen Modell 
(SP. und SP,) hier noch deutlich präziser sind. Bei 20s Vorhersagehorizont 
sind die Fehler aller Vorhersagemodelle erwartungsgemäß größer, dennoch 
kann mit den auf Streckendaten basierenden Modellen die Verlaufscharakteris- 
tik noch relativ gut vorhergesagt werden. 
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S Pme SP, MK 


920 940 960 920 940 960 920 940 960 
t l] t [s] t [s] 


(a) (b) (c) 


Abb. 3.35: Realer Verlauf (y,) und die Vorhersage (%;(r)) für T = 30s zum Zeitpunkt t = 920s der 
Fahrzeugdynamik (v, ax, a, und Pr) mit dem stochastischen Modell (a), der Punktvorhersage (b) 
und der Markov-Kette (c). Die Hintergrundfarbe indiziert die Vorhersagegiite (CRPS) fiir diesen 
Zeitpunkt. 
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Abb. 3.36: Realer Verlauf (y,) und die 10 Sekunden Vorhersage (Yo (t — 10)) der Fahrzeugdynamik 
(v, ax, a, und Pr) für den Zeitpunkt r mit der Verteilungsvorhersage des stochastischen Modells 
SPine (a), der Punktvorhersage SP, (b) und der Markov-Kette MK (c). Die Hintergrundfarbe 
indiziert die Vorhersagegiite (CRPS) fiir diesen Zeitpunkt. 
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Abbildung 3.37 zeigt die Geschwindigkeits-Vorhersagen für eine Autobahn- 
Situation (entsprechend den Streckendaten aus Abb. 3.3). Für Fahrer A (Abb. 


— yu œ Yolt-10) 


S Pme SP, 
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(b) 


Abb. 3.37: Realer Verlauf (y,) und die 10 Sekunden Vorhersage (¥;(t — 7)) der Fahrzeugdynamik 
(v, ax, a, und Pr) für den Zeitpunkt r mit dem stochastischen Modell (Links), der Punktvor- 
hersage (Mitte) und der Markov-Kette (Rechts) für zwei beispielhafte Fahrer ((a) und (b)). Die 
Hintergrundfarbe indiziert die Vorhersagegüte (CRPS) für diesen Zeitpunkt. 


3.37(a)) liegt eine freie Strecke vor und die Vorhersage mit den Streckendaten 
liefert deutlich bessere Resultate als die Markov-Kette. Treten Störungen auf, 
die nicht im erklärenden Modell berücksichtigt werden, wie zum Beispiel bei 
Fahrer B (Abb. 3.37(b)), zeigen sich auch bei Verwendung der auf Strecken- 
daten basierenden Vorhersagen stellenweise größere Abweichungen. Wobei 
die Abweichungen mit der Punktvorhersage (SP,,) in dieser Situation erneut 
größer sind als mit der Monte-Carlo-Vorhersage (SP,..). Die Markov-Kette 
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(MK) erzielt in diesem Beispiel eine vergleichbare Vorhersagegiite wie die auf 
Streckendaten basierenden Modelle. 


Diese beiden Beispielsituationen verdeutlichen die unterschiedlichen Charakte- 
ristiken der Vorhersagemodelle. Die Markov-Kette bildet die grundsätzliche 
Verteilungs- und Ubergangscharakteristik der Vorhersagegrößen ab, enthält 
aber kaum situationsspezifische Informationen. Dementsprechend treten gro- 
ße Abweichungen bei Manövern wie einer Autobahnauffahrt auf. Die auf 
Streckendaten basierenden Vorhersagen transportieren fundierte manöverspezi- 
fische Informationen. Abweichungen treten hier vor allem durch Störeinflüsse 
auf, die nicht in der Modellformulierung enthalten sind und somit auch nicht 
berücksichtigt werden können. 


Quantitative Analyse: 

Für die quantitative Bewertung werden die Vorhersagen mit den zuvor ein- 
geführten Bewertungsgrößen analysiert. Die Ergebnisse werden jeweils über 
alle Testfahrer gemittelt. Abbildung 3.38(a) zeigt den Vergleich der Bewer- 
tungsgrößen über den Vorhersagehorizont f für Verteilungsvorhersagen des 
stochastischen Modells SPnc (blau), der Markov-Kette MK (rot) und der Punkt- 
vorhersage SP, (schwarz) bei Sample-Größe K = 10. 


Die Vorhersagen der Geschwindigkeit erweisen sich für alle Zeithorizonte als 
am besten mit dem stochastischen Modell basierend auf Streckendaten, wobei 
die Vorhersagegüte für alle Modelle mit größerem Vorhersagehorizont ab- 
nimmt. Die Punktvorhersage ist bezüglich der mittleren absoluten Abweichung 
(MCRPS) vergleichbar mit der Markov-Kette, bei quadratischer Gewichtung 
des Abstands (RME'S) schneidet die Markov-Kette schlechter ab. Dies unter- 
stützt die Interpretation aus der qualitativen Analyse, dass die Punktvorhersage 
mit Streckendaten bessere Vorhersagen hinsichtlich des Verlaufs bzw. Niveaus 
der Vorhersagegröße macht, durch die Vernachlässigung der Unsicherheit aber 
schlechter im Bezug auf die Berücksichtigung der Streuung (Kalibrierung) 
abschneidet. Die Vorhersage der Markov-Kette berücksichtigt die Unsicherheit, 
schneidet aber durch das Fehlen situationsspezifischer Informationen vor allem 
im mittleren quadratischen Fehler (RME'S) schlechter ab als die Vorhersagen 
mit Streckendaten. Die stochastische Vorhersage mit Streckendaten verknüpft 
die Vorteile einer Vorhersage mit Trajektorienmodellierung mit der Berücksich- 
tigung der Unsicherheit und hat insgesamt den geringsten Vorhersagefehler. 
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Abb. 3.38: (a) Mittlere Abweichung MCRPS; und mittlere quadratische Abweichung RMES; 
über den Vorhersagehorizont f bei Sample-Größe K = 10. (b) Gemittelte Ergebnisse bei variier- 
ter Sample-Größe K. Ergebnisse für: Stochastisches Modell SP,,. (blau), Punktvorhersage SP, 
(schwarz) und Markov-Kette MK (rot). 


Die Vorhersagegüte der Längsbeschleunigung und Radleistung ist vergleichbar 
für die Markov-Kette und die Verteilungsvorhersage SP,,., die Punktvorhersage 
SP, liefert hier die schlechtesten Ergebnisse. Allgemein nimmt die Vorhersa- 
gegüte hier mit längerem Zeithorizont nur geringfügig ab. Dies deutet darauf 
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hin, dass durch die Volatilitat der Langsbeschleunigung die Vorhersagen bereits 
bei sehr kurzen Zeithorizonten nur mit einer begrenzten Genauigkeit getroffen 
werden konnen. Diese Interpretation wird auch durch das schlechte Abschnei- 
den der Punktvorhersage gestiitzt, die keine Unsicherheiten in der Vorhersage 
berücksichtigt. Da die Radleistung vor allem im Verlauf stark von der Längsbe- 
schleunigung geprägt wird, ist hier eine ähnliche Charakteristik der Ergebnisse 
zu erwarten gewesen. 


Bei der Querbeschleunigung sind die Verteilungsvorhersage SP,,. und die 
Markov-Kette in der mittleren Abweichung (MCRPS) ebenfalls deutlich bes- 
ser als die Punktvorhersage SP,. Die Variante SP,,. hat dabei etwas geringere 
Abweichungen, als die Markov-Kette. Bei quadratischer Gewichtung des Ab- 
stands (RMES) schneidet die Markov-Kette am schlechtesten ab und die beiden 
Vorhersagen mit Streckendaten liefern ein vergleichbares Ergebnis. 


Zusammenfassend erzielt die Monte-Carlo-Approximation SP,,. des stochas- 
tischen Modells vor allem für die Geschwindigkeit und Querbeschleunigung 
die beste Vorhersagegüte. Im RMES ist die Markov-Kette für diese Größen 
durchgängig am schlechtesten. Hier tritt der Vorteil bei der Verwendung von 
Streckendaten somit besonders in den Vordergrund. Bei Längsbeschleunigung 
und Radleistung sind die Vorhersagegüten der beiden Verteilungsvorhersagen 
(SPinc und MK) vergleichbar, die Punktvorhersage schneidet hier am schlech- 
testen ab. Die Vernachlässigung der Unsicherheit (Punktvorhersage) erweist 
sich gerade in der mittleren Abweichung (MCRPS) als Nachteil, während bei 
der mittleren quadratischen Abweichung (RMES) in Summe die Vorhersage 
ohne Streckendaten (Markov-Kette) zurückfällt. 


Abbildung 3.38(b) zeigt den Zusammenhang zwischen der totalen gemittel- 
ten Vorhersagegüte (MCRPS und RMES) über einer variierten Sample-Größe 
K. Erwartungsgemäß nimmt der Fehler der stochastischen Vorhersagen mit 
zunehmender Sample-Größe geringfügig ab. Da der Unterschied hier aber 
nicht signifikant ist, kann der Einfluss des Fehlers durch die Ungenauigkeit 
einer Monte-Carlo-Approximation der Verteilungen als klein gegenüber dem 
allgemeinen Vorhersagefehler angenommen werden. 


Das ähnliche Abschneiden der stochastischen Vorhersagen SP,,. und MK in 
den Bewertungsgrößen für Längsbeschleunigung und Radleistung überrascht 
nach der qualitativen Analyse der Beispielsituationen. In einer subjektiven 
Analyse scheint die auf Streckendaten basierende Vorhersage hier deutlich 
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treffsichere Vorhersagen zu liefern. Da die Bewertungsgrößen MCRPS und 
RMES eine kombinierte Bewertung von Schärfe und Kalibrierung der Vor- 
hersagen darstellen, wird im Folgenden die Schärfe der Vorhersagen über die 
Breite der zentralen Vorhersageintervalle untersucht. Abbildung 3.39 zeigt 
die Entwicklung der Breite des zentralen 75%-Vorhersageintervalls über den 
Vorhersagehorizont für das stochastische Modell und die Markov-Kette. Es 
zeigt sich übergreifend über alle Vorhersagegrößen, dass das stochastische Mo- 
dell deutlich schmalere Vorhersageintervalle liefert als die Markov-Kette. Als 
Schlussfolgerung lässt sich ableiten, dass SP. somit zwar schärfere Vorhersa- 
gen generiert und das Niveau der Größen besser vorhersagt, aber im statistisch 
strengen Sinne schlechter kalibriert ist. 


Unbekannte Strecke 


Da die Markov-Kette im Rahmen dieser Arbeit zwangsläufig mit den Trai- 
ningsdaten der befahrenen Teststrecke trainiert wird, ist eine sinnvolle Referenz 
für eine unbekannte Strecke hier nicht möglich. Daher wird an dieser Stelle 
nur ein Vergleich der auf Streckendaten basierenden Vorhersagemodelle mit 
bekannter und unbekannter Routenführung durchgeführt. Da Abbiegungen und 
Kreuzungssituationen nur einen begrenzten zeitlichen Anteil an einer gesam- 
ten Testfahrt haben, sind keine signifikanten Unterschiede in den mittleren 
Bewertungsgrößen zu erwarten. 
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Abb. 3.39: Über alle Fahrten gemittelte Breite des 75%-Vorhersageintervalls der Fahrzeugdynamik 
(v, ax, a, und Pr) für den Vorhersagehorizont 7 bei Sample-Größe K = 10 für Vorhersagen des 
stochastischen Modells SP,,. (blau) und der Markov-Kette MK (rot). 
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In Tabelle 3.5 sind die Bewertungsgrößen für bekannte und unbekannte Strecke 
in Prozent, normiert auf die Resultate der Verteilungsvorhersage SP,,. bei be- 
kannter Strecke, aufgeführt. Die Abweichung der Geschwindigkeitsvorhersage 
nimmt bei unbekannter Strecke für das stochastische Modell um CRPS 7% 
(RMES 10%) zu. Die Vorhersage der Querbeschleunigung wird um 4% (8%) 
schlechter. Für Längsbeschleunigung und Radleistung ist die Zunahme der 
Abweichungen deutlich geringer. 


Bei der Punktvorhersage verschlechtert sich die Geschwindigkeitsvorhersage 
um 9% (11%). Die Vorhersage der Querbeschleunigung weist um 7% (9%) 
höhere Abweichungen auf. Für die Punktvorhersage verschlechtert sich auch 
die Leistungsvorhersage um >4%. 


Bei der Punktvorhersage ist die absolute Zunahme der Abweichung durch eine 
unbekannte Streckenführung etwas größer als für die stochastische Vorher- 
sage. Durch die zwangsläufig unschärfere Information nimmt aber auch die 
Abweichung der Monte-Carlo- Vorhersage zu. Die vergleichsweise geringe Ver- 
schlechterung der Vorhersagen in der Längsbeschleunigung und Radleistung 
verdeutlicht, dass diese beiden Größen auch schon mit bekannter Routenfüh- 
rung schwerer vorherzusagen sind. 


Tabelle 3.5: Mittlere Abweichung MCRPS und mittlere quadratische Abweichung RMES für Vor- 
hersagen der Fahrzeugdynamik (v, a,, a, und Pr) mit dem stochastischen Modell bei unbekannter 
Strecke und der Punktvorhersage mit bekannter und unbekannter Strecke. Angaben in Prozent, 
bezogen auf die Ergebnisse des stochastischen Modells bei bekannter Strecke. 


Stochastisches Modell Punktvorhersage 


unbekannte Strecke bekannte Strecke unbekannte Strecke 
MCRPS RMES MCRPS RMES | MCRPS RMES 


v 107.3% 110.6% | 130.7% 106.9% | 139.3% 118.0 % 
ax 100.2% 101.1% | 129.1% 109.9% | 130.4% 111.1% 
ay 104.1% 108.0% | 120.1% 107.8% | 126.9% 116.2% 
Pr 101.5% 102.5% | 131.3% 109.0% | 135.5% 112.4% 
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3.8.5 Fazit 


Die Analyse zeigt, dass das stochastische Modell basierend auf Streckendaten 
die grundsätzliche Charakteristiken der Vorhersagegrößen deutlich spezifischer 
abbildet als die Zeitreihen-Modellierung mit einer Markov-Kette. Die Markov- 
Kette bildet für die volatileren Zustände (ay, ay und Pr) zwar die grundsätzliche 
Streuung ab, situations- oder manöverspezifische Informationen können hier 
aber kaum wiedergegeben werden. Die Punktvorhersage schneidet in der quan- 
titativen Bewertung insgesamt am schlechtesten ab, da sie die Unsicherheit der 
Vorhersagen zwangsläufig nicht berücksichtigen kann. 


Dies verdeutlicht die grundsätzlichen Stärken und Schwächen der Vorher- 
sagemodelle: Erklärende Modelle (hier die auf Streckendaten basierenden 
Modelle) enthalten deutlich präzisere Informationen über die aktuelle Situation. 
Nicht berücksichtigte Störungen und Einflüsse können aber zu systematischen 
Abweichungen führen. Durch die Modellierung der Unsicherheit in der Di- 
mension der Steuerparameter des Modells ist die statistische Inferenz und 
Kalibrierung mit höheren Schwierigkeiten verbunden. Ein Zeitreihenmodell 
(hier die Markov-Kette) arbeitet direkt in der Dimension der Vorhersagegröße. 
Durch diese direkte Modellierung kann die Streuung unmittelbar ermittelt wer- 
den und somit eine bessere Kalibrierung erzielt werden. Die sehr unscharfen 
Vorhersagen des Modells spiegeln dabei aber nur grundsätzliche Charakteristi- 
ken wieder und liefern somit wenig situative Informationen. 


Es ist dabei zu beachten, dass bei den quantitativen Bewertungsgrößen (MCRPS 
und RMES) ein zeitschrittweiser Vergleich von Vorhersage und Realisierung 
erfolgt. Zeitkorrelationen und -verläufe werden somit nicht berücksichtigt. 
Ebenso wird keine Gewichtung der Relevanz von Manövern oder Situationen 
vorgenommen. Die Bewertungsgrößen geben damit zwar einen Aufschluss 
über die allgemeine Abweichung und Güte der Vorhersagemodelle, eine sys- 
temspezifische Eignung und Qualität der Vorhersagen kann daraus aber nicht 
direkt abgeleitet werden. 
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4 Vorausschauende Steuerung 
von Fahrzeugsystemen 
4.1 Stochastisch optimale Regelung 


Wie bereits in Abschnitt 2.2 beschrieben, formuliert sich das stochastische 
Optimalsteuerungsproblem im allgemeinen Fall als 


V* = min E [V7] (4.1a) 
u. d. N.: X = fy(X¢_-1, 07-1, ¥-1) Vi, (4.1b) 
ucU, xE Vt, (4.1c) 


wobei das zu minimierende Gütemaß über den Erwartungswert der kumulierten 
Schrittgüten E [Vr] mit 


T-1 
2 [Vr] = E [J (Xr, ¥r)] + $ E [Js(X7, uz, ®)] (4.2) 
7=0 


definiert wird. Im Kontext dieser Arbeit wird von einem diskreten und endlichen 
zulässigen Wertebereich U der Steuergröße u ausgegangen. 


Für die Lösung des Optimalsteuerungsproblems muss dabei nach den Eigen- 
schaften des Systems bzw. der Übertragungsfunktion unterschieden werden. 
Die zuvor behandelten Vorhersagegrößen y werden aus der Sicht des zu re- 
gelnden Systems als Umgebungsgrößen bezeichnet. Dabei wird im Folgenden 
vorausgesetzt, dass die Verteilungen Ê der Umgebungsgröße y durch Sample- 
Vorhersagen Êg gegeben sind. 


Ist die optimale Steuertrajektorie u* durch Lösen des Optimalsteuerungspro- 
blems bekannt, wird der erste Wert der optimalen Steuertrajektorie uj auf das 
System angewendet. Diese Verfahrensweise wird als One-Step-MPC bezeich- 


109 


4 Vorausschauende Steuerung von Fahrzeugsystemen 


net. Das Optimalsteuerungsproblem wird dabei in jedem Rechenzyklus Ar 
gelöst. 


Sei u folgend ein realisierter Vektor optimaler Ein-Schritt-Steuergrößen mit 
u = [uo,un,...ur-ı) = [w(t = 0), u9(1),..-,uo(T — 1)] , (4.3) 


wobei u(t) der erste Wert der optimalen Steuertrajektorie berechnet zum 
Zeitpunkt ¢ ist sowie x die zugehörige resultierende Zustandstrajektorie. Ent- 
sprechend der Gütefunktion Vr des Optimalsteuerungsproblems lässt sich eine 
realisierte Steuer- bzw. Zustandstrajektorie mit der erzielten Regelgüte R mit 


T—1 


R=Jp(xr,yr)+ $ Jx uy) (4.4) 
t=0 


bewerten. Die bestmögliche erzielbare Regelgüte für eine Fahrt kann durch 
Lösen des Optimalsteuerungsproblems mit der tatsächlichen Realisierung y 
der Vorhersagegröße (Vektor der Fahrzeugdynamikgrößen entsprechend Glei- 
chung 3.8) ermittelt werden. Diese wird im Folgenden als Ropt bezeichnet. 
Die erzielte Regelgüte R kann somit zur Bewertung der Regelung sowie zum 
direkten Vergleich der Eignung unterschiedlicher Vorhersagen für ein System 
herangezogen werden. 


4.2 Aktive und Adaptive Aerodynamik 


Nachdem in den vorherigen Abschnitten Lösungsmöglichkeiten des Optimal- 
steuerungsproblems behandelt wurden, soll in den folgenden Abschnitten die 
Anwendung der Vorhersagen für vorausschauende Regelungen an Beispiel- 
systemen evaluiert und diskutiert werden. Hierfür wird zunächst eine voraus- 
schauende Steuerung einer aktiven Aerodynamik als Systembeispiel mit einem 
diskreten Zustandsraum betrachtet. 


Viele Sportwagen der aktuellen Generation sind mit unterschiedlichen adapti- 
ven bzw. aktiven Aerodynamik-Elementen ausgestattet. Der Porsche 911 Turbo 
besitzt beispielsweise einen verstellbaren Bugspoiler sowie einen ebenfalls 
mehrstufig verstellbaren Heckflügel. Die Ausgangsstellung der Verstellelemen- 
te ist dabei auf hohe Alltagstauglichkeit und große Böschungswinkel ausgelegt. 
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Der Bugspoiler besteht aus einem pneumatisch ausfahrbaren Elastomer. Der 
Heckflügel wird elektrisch angesteuert und ist in der Ausfahrhöhe und An- 
stellung variabel. Teilweises Ausfahren der Aerodynamikelemente führt dabei 
zunächst zu einer Reduktion der Auftriebswerte und damit erhöhter Fahrstabili- 
tät. Bei voll ausgefahrenen Aerodynamikelementen wird zusätzlicher Abtrieb 
an Vorder- und Hinterachse erzeugt um Fahrstabilität und Performance weiter 
zu erhöhen. Der Luftwiderstand ist dabei erhöht gegenüber der eingefahrenen 
Stellung und der Zwischenstellung. (vgl. (MWP14, Por)) 


Abb. 4.1: Ausfahrbarer Heckflügel und verstellbarer Bugspoiler eines Porsche 911 Turbo. ©Dr. 
Ing. h.c. F. Porsche AG 


Ein weiteres Modell mit adaptiven Aerodynamikelementen ist der Porsche 911 
Carrera. Der ausfahrbare Heckspoiler des Porsche 911 Carrera dient dazu, den 
Hinterachs-Auftrieb und den Luftwiderstand bei höheren Geschwindigkeiten 
zu reduzieren. Die Verstellung erfolgt ebenfalls Geschwindigkeitsabhängig. 
Durch Ausfahren des Spoilers wird der Luftwiderstandsbeiwert von cw = 0.31 
auf cw = 0.29 gesenkt. (Sch13) 
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Die Verstellung solcher adaptiver Aerodynamik-Elemente erfolgt dabei übli- 
cherweise abhängig von festen Geschwindigkeitsschwellwerten oder durch 
manuelle Bedienung, beispielsweise über die Wahl eines entsprechenden Fahr- 
programms (MWP14, Sch13). Beim Einsatz von geschwindigkeitsabhängi- 
gen Verstellschwellen sind dabei Stellhysteresen notwendig, um ein häufiges 
Verstellen der Elemente bei Pendeln um die entsprechende Geschwindigkeits- 
schwelle zu verhindern. Auf Performanz ausgerichtete Stellungen (erhöhter 
Abtrieb, erhöhter Luftwiderstand) werden dabei über ein gewähltes Fahrpro- 
gramm oder manuelle Einstellung der Position angesteuert, da eine situations- 
angepasste Wahl der Stellung ohne Informationen über die voraus liegende 
Strecke nicht möglich ist. Der situationsangepassten Steuerung stehen dabei die 
Trägheit der Stellglieder und die schlechte Vorhersehbarkeit querdynamischer 
Anforderungen entgegen. Zwar kann die Verstellzeit bei Einsatz hydraulischer 
Stellglieder gegenüber elektrischen Stellgliedern reduziert werden, aber es ist 
dennoch zu beachten, dass Verstellungen der Aerodynamikelemente während 
transienter Übergänge (Einlenken in eine Kurve) vermieden werden sollten, 
da sich durch die veränderte Auftriebsbalance auch die fahrdynamische Cha- 
rakteristik des Fahrzeugs ändert. Eine auf Performanz ausgerichtete Stellung 
sollte daher gewählt werden, bevor fahrdynamische Anforderungen entste- 
hen, um die Fahrstabilität entsprechend zu erhöhen und keine für den Fahrer 
unvorhersehbaren Lastwechsel zu generieren. 


Im Folgenden wird eine vorausschauende und damit situationsgerechte Steue- 
rung von adaptiven Aerodynamik-Elementen vorgestellt und untersucht. 


4.2.1 Systemmodell und Lösung des 
Optimalsteuerungsproblems 


Für das Systemmodell bei dieser Anwendung kann ein diskreter Zustand x 
definiert werden, der die diskreten Positionen der Aerodynamikelemente ab- 
bildet. Es wird davon ausgegangen, dass der Systemzustand innerhalb eines 
Zeitschrittes Ar = 1 verstellt werden kann. Mit der Sollverstellung u ist die 
Systemübertragungsfunktion somit durch 
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X41 = fs (Xr, Ut, Yt) = Xt + ur), 


4.5 
xe Mi; u€ [...,—1,0,1,...] en) 


gegeben. 


Die Lösung des Optimalsteuerungsproblems für diesen Fall kann im Allge- 
meinen mittels dynamischer Programmierung gefunden werden. Dynamische 
Programmierung bezeichnet eine algorithmische Verfahrensweise zur Lösung 
eines mehrstufigen Entscheidungsproblems und wurde maßgeblich von Richard 
Bellman auf dem Gebiet der mathematischen Optimierung und Computer Wis- 
senschaften etabliert (siehe z.B. (Bel57, Bel62)). Bellman formulierte dabei 
das folgende Optimalitätsprinzip: 


„An optimal policy has the property that whatever the inital state and initial 
decision are, the remainig decisions must constitute an optimal policy with 
regard to the state resulting from the first decision“ . (Bel62, S. 15) 


Demzufolge kann das Gesamtproblem in einzelne Subprobleme (Zeitschritte) 
zerlegt werden und die Lösung des Gesamtproblems setzt sich aus den optima- 
len Lösungen der Teilschritte zusammen. Dies entspricht folgender Umformung 
des Optimierungsproblems: 


T-1 
v* = min | 43, (XT, yr) T > sn) 
(4.6) 


= | y, (xr,yr) + min | + minE,, (X, 1u0,yo) 

Bei der algorithmischen Umsetzung wird dabei üblicherweise eine Matrix der 
optimalen Kosten der Teilprobleme für jeden Zustand x; sowie eine Matrix der 
optimalen Aktionen u;_;, die zu diesen Kosten geführt haben, definiert. Die 
Matrix der optimalen Kosten sei V = V (x7, al x,|xT]> die Matrix der optimalen 
Aktionen II = IT (27, al x,|x7T] und die zugehörigen Vorgängerzustände X, = 
Xv (XP) æT] 


Algorithmus 2 beschreibt die Lösung von Gl. (4.6) mittels dynamischer Pro- 
grammierung in einer vorwärts orientierten Formulierung. Als Resultat wird 
die optimale Zustandstrajektorie x]. und die zugehörige optimale Strategie 
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Abb. 4.2: Schematische Darstellung des Suchraums der dynamischen Programmierung fiir einen 
Zeithorizont T mit Systemzustand x, Stellgröße u und optimalen Kosten V (x,t) des Zustands x 
zum Zeitpunkt t sowie einer beispielhaften optimalen Zustandstrajektorie u*. 


T* = ug.p_, ausgegeben. Der Suchraum der dynamischen Programmierung ist 
in Abb. 4.2 schematisch dargestellt. 


Ist die optimale Steuertrajektorie u* durch Lösen des Optimalsteuerungspro- 
blems bekannt, wird der erste Wert der optimalen Steuertrajektorie uj auf das 
System angewendet (One-Step-MPC). 


4.2.2 Reduktion des Luftwiderstands 


Zunächst wird eine beispielhafte Systemkonfiguration mit zwei Zuständen 
untersucht. Zustand x = 1 entspricht dabei einer Design-Position (z.B. einge- 
fahrener Heckspoiler) und ist die Standardposition. Zustand x = 2 entspricht 
einer Position mit reduziertem Luftwiderstand, die entsprechend bei höheren 
Geschwindigkeiten angefahren werden soll. Die Anzahl der Verstellungen soll 
dabei möglichst gering sein, um die Bauteilbelastung sowie etwaige Komfort- 
beeinträchtigung durch Verstellgeräusche gering zu halten. 
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Algorithmus 2 : Dynamische Programmierung 


Input : Anfangszustand xo 
Output : Optimale Steuer- und Zustandsverläufe u* und x* 
begin 
V(xz,f) Go Vt € [0,7], Vx; € As; 
V(x0,0) + 0; 
/* Vorwartsrechnug zur Ermittlung der Matrizen 
der optimalen Kosten und Vorgängerzustände */ 
for f + 0,T — 1 do 
for Yx; € X, do 
for Vu; € U4 do 
x1 — fs(xr, ur); 
Vu — V(ar,f) +J, (a, ur, Yr); 
if View < V (x1, + 1) then 
V (x74 ’ i+ 1) s= Vew 
I(x, f+ 1) — Uf; 
Xy(xp1,f +1) & 27; 


/* Ermittlung des optimalen Endzustands */ 
V* 4 minę V (xr,T); 

xp + argminw |V (xr, T )]; 

/* Rekonstruktion des optimalen Pfads */ 
for 7 + [T,1] do 

| Sr Khan; 


už + Il@f,f); 


Das Zielverhalten des Systems wird durch eine generischen Kostenfunktion 
J«(x,y) beschrieben. Die relevante Umgebungsgröße ist in diesem Fall die 
Geschwindigkeit v. Damit gilt: 


Jy = f (x,v). (4.7) 


Da der Luftwiderstand quadratisch mit der Geschwindigkeit ansteigt, ist es 
naheliegend die Kosten J,(x = 1,v) entsprechend quadratisch mit v zu wählen. 
Ein Beibehalten der aerodynamischen Position bei geringeren Geschwindigkei- 
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ten ist unerwiinscht. Daher werden fiir Zustand x = 2 entsprechende Kosten fiir 
geringere Geschwindigkeiten veranschlagt. Fiir diese Kosten wird ein quadrati- 
scher Anstieg mit sinkender Geschwindigkeit definiert. Abb. 4.3 zeigt die Kos- 
tenfunktion J, abhängig vom Systemzustand x. Die Trade-off-Geschwindigkeit 
liegt in diesem Fall bei 75 km/h ~ 21 m/s. Verstellungen des Systemzustands 
x werden mit einem konstanten Kostenterm J, = Ju, für u # 0 bewertet. Je 
größer der Wert Ja gewählt wird, desto geringer ist die angestrebte Anzahl 
an Verstellungen des Systems. Die Verstellkosten werden im Folgenden mit 
Jug = 5 gewählt. 


1 

a7 I(x = 1,v) 

~ 0.5 J(2=2,v) 
0 


0 10 20 30 40 50 
v [m/s] 


Abb. 4.3: Zustandskosten J; abhängig vom Systemzustand x = 1 (rot) und x = 2 (blau) über der 
Fahrgeschwindigkeit v. 


Das Optimalsteuerungsproblem fiir das dargestellte System kann, wie in Ab- 
schnitt 4.2.1 beschrieben, über dynamische Programmierung gelöst werden. 
Die realisierten Steuer- bzw. Zustandsverläufe u und x können mit der erzielten 
Regelgüte R (siehe Gl. (4.4)) bewertet werden. 


Für die Vorhersage der Fahrzeuggeschwindigkeit v und in Folge zur Ermittlung 
der optimalen Strategie werden dabei die bereits zuvor vorgestellten Vorher- 
sagemodelle SP,,-, SP, und MK eingesetzt. Die zugehörigen Zustands- und 
Steuerverläufe werden mit XSP ne? ŽSP,> XMK und u SP? Usp,» UMK bezeichnet, die 
Regelgüten entsprechend mit Rsp,.,Rsp, und Ryx. Die Vorhersagen werden 
wie in Abschnitt 3.8.4 mit einem Initialisierungslauf zur Parameterschätzung 
berechnet. 


Bekannte Strecke: Zunächst werden die Ergebnisse für eine bekannte Routen- 
führung diskutiert. 
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In Abbildung 4.4 sind die realisierten Zustandsverläufe x ((c) und (d)) sowie die 
optimalen Referenzverläufe x,,, ((a) und (b)) über der gefahrenen Geschwin- 
digkeit fiir zwei beispielhafte Ausschnitte zweier Testfahrten dargestellt. In 


—, 40 2 
n 
> ob 1* 0 
200 400 600 800 1650 1700 1750 1800 1850 
t [s] t [s] 
(a) (b) 


v [m/s] 


650 1700 1750 1800 18 


400 600 


v [m/s] 


DVA 


0 
200 400 600 800 1650 1700 1750 1800 18 


0 

200 400 600 800 1650 1700 1750 1800 1850 
t [s] t [s] 
(c) (d) 


Abb. 4.4: Gefahrene Geschwindigkeit v und optimale Referenzstrategie X opr für zwei Beispiel- 
fahrten ((a) und (b)) sowie die realisierten Zustandsverläufe (x; SP„e> Xi SP, und x, mK) mit den 
unterschiedlichen Vorhersagemodelle (SPinc, SP, und MK) ((c) und (d)). 


der links dargestellten Situation sind die Zustandsverläufe mit den Vorhersa- 
gemodellen SP,,, und SP, fast identisch mit der optimalen Referenz. Durch 
die fehlende Situationsinformation der Markov-Kette (WK) werden unnötige 
Verstellungen, beispielsweise bei Kurvendurchfahrt (z.B. t ~ 300s), ausgelöst. 
In der rechts dargestellten Situation (d) zeigt sich unterschiedliches Verhalten 
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vor allem bei Auffahren und Verlassen der Autobahn. Während mit den auf 
Streckendaten basierenden Modellen bereits bei Uber- oder Unterschreiten 
der Trade-off-Geschwindigkeit in die entsprechende Position gewechselt wird, 
reagiert die Regelung bei Verwendung der Markov-Kette hier verzögert, da 
das konkrete Wissen über die Situation fehlt. Weiterhin wird mit der Punktvor- 
hersage (SP,) und der Markov-Kette eine unnötige Verstellung bei t ~ 1830s 
ausgelöst, die mit dem stochastischen Modell vermieden werden kann. 


Abb. 4.5 zeigt die mittlere Regelgüte R (normiert auf die mittlere Regelgüte 
Ropt) bzw. die Verteilung der Regelgüte R über alle Testfahrer. Die modellbasier- 


= 13 213 x 
me 1.2 S 12} 7 KI 
= k = 7 F 
SPne SP, MK SPs SP, MK 

(a) (b) 


Abb. 4.5: Erzielte Regelgiite normiert auf die mittlere optimale Regelgüte Rop für die unter- 
schiedlichen Vorhersagemodelle (SPec, SP, und MK), gemittelt über alle Testfahrten. (a) Mittlere 
Regelgüte R, (b) Box-Whisker-Plot von R mit Median, Interquartilbox und Maximal- bzw. Mini- 
malwerten. 


ten Vorhersagen (SP,.. und SP,) erzielen jeweils deutlich bessere Regelgüten 
als die Markov-Kette (MK). Dabei sind die Resultate mit der stochastischen 
Vorhersage (SP nc) im Mittel etwas besser als mit der Punktvorhersage (SP,). 
Das deutlich schlechtere Abschneiden der Markov-Kette in der mittleren Regel- 
güte über alle Fahrten zeigt ein übereinstimmendes Bild mit den beispielhaften 
Zustandsverläufen aus Abb. 4.4. Die Markov-Kette ist für dieses Systembeispiel 
somit deutlich schlechter geeignet und lässt die notwendige Informationsschär- 
fe vermissen. 


Diese Beispielsituationen verdeutlichen die Auswirkungen der unterschiedli- 
chen Vorhersagemodelle, die auch in der quantitativen Zielerreichung (Regelgü- 
te R) widergespiegelt werden. Die auf Streckendaten basierenden Vorhersagen 
schneiden hier deutlich besser ab als die Markov-Kette. Die Verhältnisse der 
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erzielten Regelgiiten spiegeln dabei in etwa die Verhältnisse des RMES der 
Geschwindigkeit wieder, was angesichts der quadratischen Zielfunktion in der 
Geschwindigkeit mit den Erwartungen übereinstimmt. Die Markov-Kette kann 
die fehlenden situationspezifischen Informationen folglich nicht durch eine bes- 
sere statistische Kalibrierung ausgleichen und führt zu einem unzureichenden 
Systemverhalten. Die Monte-Carlo-Approximation resultiert in geringfügig 
besserem Systemverhalten als die Punktvorhersage. 


Unbekannte Strecke: In Abb. 4.6 sind die Ergebnisse der auf Streckendaten 
basierenden Modelle für unbekannte Routenführung dargestellt. Die erzielten 


1.2 


HE bekannte Strecke 
HE unbekannte Strecke 


SPne SP, 


Abb. 4.6: Erzielte mittlere Regelgüte R normiert auf die mittlere optimale Regelgüte Ro»; für die 
auf Streckendaten basierenden Vorhersagemodelle bei bekannter und unbekannter Route. 


Regelgüten zwischen bekannter und unbekannter Routenführung unterscheiden 
sich hier nicht signifikant. Dies ist darauf zurückzuführen, dass die von der 
Unsicherheit beeinflussten Fahrsituationen nicht die relevanten Entscheidungs- 
situationen für das System sind und somit nur geringfügigen Einfluss auf die 
Zustandsverläufe haben. Auf eine ausführliche Darstellung der Zustandsverläu- 
fe wird daher verzichtet. 


4.2.3 Performanzorientierte Aerodynamik 


In einem zweiten Beispiel wird das System um eine auf Performanz ausge- 
richtete Stellung erweitert. Diese dritte Position der Aerodynamikelemente 
(Systemzustand x = 3) entspricht einer Stellung mit erhöhtem Abtrieb, um 
eine höhere Fahrstabilität und Grenzdynamik zu ermöglichen. Hierfür wird die 
Kostenfunktion J; um einen querdynamischen Anteil erweitert. Da die Aero- 
dynamik nicht in Übergangsphasen (z.B. Einlenken in eine Kurve) verstellt 
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werden soll, wird nicht direkt die Querbeschleunigung zum Zeitpunkt t (ay;) in 
der Zielfunktion beriicksichtigt. Stattdessen wird eine virtuelle Querdynamik- 
größe d, verwendet. d, ist der Maximalwert der absoluten Querbeschleunigung 
über ein gleitendes Zeitfenster mit 


in, = orl. 4.8 
ays Se, layz! (ea) 


Abbildung 4.7 zeigt einen beispielhaften Verlauf der Querbeschleunigung sowie 
der virtuellen Querdynamikgröße dy. 


ay [m/s?] 


380 400 420 440 460 
t [s] 


Abb. 4.7: Betragsmäßiger Verlauf der Querbeschleunigung ay sowie entsprechender Verlauf der 
virutellen Querdynamikgröße dy. 


Die Zustands-abhängige Zielfunktion Jy wird um diese Querdynamikgröße 4, 
erweitert: 
Jy = f(x,v,ä,). (4.9) 


Dabei werden zur Kostenfunktion aus Abschnitt 4.2.2 für die Zustände x = 1 
und x = 2 zusätzliche Kostenterme für auftretende Querdynamik ä, ergänzt. 
Für den Zustand x = 3 werden entsprechende Kosten für die Abwesenheit 
von Querdynamik ä, berücksichtigt. Abbildung 4.8 zeigt die Differenz der 
Zustandskosten für die 3 möglichen Systemzustände über Kombinationen von 
Geschwindigkeit und Querdynamik. Die Zielfunktion ist dabei so definiert, 
dass die Querdynamikschwelle, ab der die Performanz-Stellung bevorzugt wird, 
mit zunehmender Geschwindigkeit abnimmt. Dadurch wird die zunehmende 
Relevanz der Fahrstabilität bei höheren Geschwindigkeiten berücksichtigt. 


Bekannte Strecke: Die erzielten Regelgüten bei bekannter Routenführung 
für dieses System sind in Abbildung 4.9 dargestellt. Es zeigen sich ähnliche 
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10 20 30 0 10 20 
v [m/s] v [m/s] v [m/s] 


(a) (b) (c) 


Abb. 4.8: Kostendifferenz J,(i, v, ãy) — Jy (j, v, dy) über Fahrgeschwindigkeit v und Querdynamik- 
größe ä, zwischen den Zuständen 2 und 1 (a), 3 und 2 (b) sowie 3 und 1 (c). In den blauen 
Bereichen wird der erstgenannte Zustand angestrebt. 


1.6 1.6 x 
Š 14 i Š 14 
x er 
x 1.2 5 1.2 T 5 
1 1.1.5 x 
GPa, SP, MK SP. SP, MK 
(a) (b) 


Abb. 4.9: Erzielte Regelgüte normiert auf die mittlere optimale Regelgüte R,p für die unter- 
schiedlichen Vorhersagemodelle, gemittelt über alle Testfahrten. (a) Mittlere Regelgüte R, (b) 
Box-Whisker-Plot von R mit Median, Interquartilbox und Maximal- bzw. Minimalwerten. 


Verhältnisse wie bei dem Systembeispiel mit zwei Zuständen. Die Ergebnisse 
mit der Markov-Kette sind deutlich schlechter als die der auf Streckendaten 
basierenden Vorhersage. Bei den auf Streckendaten basierenden Vorhersagen 


werden etwas bessere Ergebnisse mit der stochastischen Vorhersage (SPnc) 
erzielt. 


Abbildung 4.10 zeigt einen beispielhaften Ausschnitt der Testfahrten mit den 
resultierenden Zustandsverläufen x bei Verwendung der unterschiedlichen Vor- 
hersagen sowie der optimalen Referenzstrategie. Auffällig ist, dass mit der 
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v m/s] 


v [m/s] 


v [m/s] 


0 j 800 900 1000 
a 36 6% m3 
EA ‘2: 
>, MACNA Wa @ Eeh 
600 700 800 900 1000 _ 
t [s] 
(b) 


Abb. 4.10: Gefahrene Geschwindigkeit v, Querbeschleunigung ay und optimale Referenzstrategie 
Xtopt (a) sowie die realisierten Zustandsverläufe x; sp,.. X SP,» Xt.MK für die unterschiedlichen 
Vorhersagemodelle (b). 


Markov-Ketten-Vorhersage der Performance-orientierte Zustand in diesem Ab- 
schnitt nie angesteuert wird. Dies verdeutlicht die mangelnde Schärfe dieser Art 
von Vorhersage für die dynamischeren Vorhersagegrößen (ax, ay), die bereits 
in den Analysen in Abschnitt 3.8.4 festgestellt wurde. Die Markov-Kette bildet 
zwar die Unsicherheit und die charakteristische Verteilung der Querdynamik 
ab, die Information ist dabei aber zu unspezifisch um als Entscheidungsgrund- 
lage für das System dienen zu können. Die Vorhersage ist somit nicht scharf 
genug und resultiert in einer entsprechend großen Zielabweichung von der 
Referenzstrategie. Die beiden auf Streckendaten basierenden Vorhersagen re- 
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sultieren in einem sehr ähnlichen Zustandsverlauf des Systems, wobei mit der 
Punktvorhersage bei ¢ ~ 800 einige unnötige Verstellungen ausgelöst werden. 


Um das Auftreten der Systemzustände abhängig von der Fahrgeschwindigkeit 
und Querbeschleunigung zu untersuchen, sind in Abb. 4.11 die Kombinationen 
aus Systemzustand x und den Fahrzeugdynamikgrößen für eine beispielhafte 
Fahrt und die unterschiedlichen Vorhersagemodelle dargestellt. Zur Visuali- 
sierung des Zielverhaltens sind die Differenzkosten entsprechend Abb. 4.8 im 
Hintergrund dargestellt. Diese qualitative Darstellung zeigt, dass die über die 
Zielfunktion angestrebten Systemzustände mit den auf Streckendaten basieren- 
den Vorhersagen sehr gut umgesetzt werden konnten. Für fast alle Phasen mit 
hoher Querdynamik wurde der Performance-orientierte Systemzustand (x = 3) 
eingestellt. Mit der Markov-Kette wird dieser Performance-orientierte Zustand 
über die ganze Fahrt nicht eingesetzt. Die Aussage über fehlende Schärfe der 
Querdynamikvorhersagen der Markov-Kette lässt sich somit auf die gesamte 
Strecke übertragen. 


Unbekannte Strecke: Bei unbekannter Routenführung ergeben sich auch in 
diesem Beispiel nur geringfügig abweichende Ergebnisse. Die erzielte Regelgü- 
te verschlechtert sich für beide auf Streckendaten basierenden Modelle, wobei 
die Verschlechterung für die stochastische Vorhersage etwas größer ausfällt 
und sich für die stochastische Vorhersage kein signifikanter Vorteil mehr ergibt 
(siehe Abb. 4.12). 


4.2.4 Fazit 


Die Beispiele für die Steuerung von aktiven Aerodynamikelementen zeigen, 
dass auf Streckendaten basierende Vorhersagen eine deutlich bessere Perfor- 
mance ermöglichen als eine reine Zeitreihenmodellierung über eine Markov- 
Kette. Die Ergebnisse zeigen damit auch, dass die statistische Kalibrierung 
einer Vorhersage alleine nicht ausreichend für die vorausschauende Steue- 
rung eines Systems ist. Vielmehr ist eine gewisse Schärfe der Vorhersagen 
erforderlich, um Entscheidungen für eine vorausschauende Steuerung zu er- 
möglichen. Beim Vergleich der auf Streckendaten basierenden Vorhersagen 
erweist sich der Einsatz von Verteilungsvorhersagen jedoch als vorteilhaft, da 
dadurch eine robustere Regelstrategie erzielt werden kann, als mit einer reinen 
Punktvorhersage. 
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10 20 30 10 20 3 
v [m/s] v [m/s] v [m/s] 


Abb. 4.11: Resultierende Kombinationen aus Systemzustand x (links x € {1,2}, Mitte: x € {2,3}, 
Rechts: x € {1,3}) und Fahrzeugdynamik (v und dy) für eine beispielhafte Testfahrt. Ideale 
Vorhersage (1. Reihe), SPmc (2. Reihe), SP, (3. Reihe) und MK (4. Reihe). Hintergrundfarbe: 
Differenz der Kostenfunktion J, für die Zustände entspr. Abb. 4.8. 
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1.3 
5 1.2 
a HE bekannte Strecke 
ae HE unbekannte Strecke 
IRQ . 
1 


SPu SP, 


Abb. 4.12: Erzielte mittlere Regelgiite R normiert auf die optimale Regelgüte Rop, für die auf 
Streckendaten basierenden Vorhersagemodelle bei bekannter und unbekannter Route. 


4.3 Vorausschauendes Thermomanagement 
einer elektrischen Maschine 


Für ein zweites Anwendungsbeispiel soll ein System gewählt werden, das die 
Betrachtung eines kontinuierlichen Zustandsraums X erfordert. Hierfür kommt 
ein vorausschauendes Thermomanagement des Fahrzeugs in Betracht. 


Vorausschauendes Thermomanagement wurde bereits vielfach für konventionel- 
le Fahrzeuge behandelt (siehe z.B. (Goß09, BLEK10, GS12)). Bei Fahrzeugen 
mit Verbrennungsmotor ist dabei vor allem die Abhängigkeit der Motorverlust- 
leistung von den mittleren Bauteiltemperaturen von Interesse, da ein Anheben 
der mittleren Bauteiltemperaturen zu Verbrauchsvorteilen führt. Durch die zu- 
nehmende Bedeutung von Elektrofahrzeugen ist auch das intelligente Thermo- 
management für elektrische Antriebe zunehmend im Fokus der Forschung. In 
(Auel5) und (AWWK15) werden zum Beispiel die Potentiale zur Verbrauchs- 
senkung eines Elektrofahrzeugs durch vorausschauendes Thermomanagement 
betrachtet. Dabei werden die Energiebedarfe für das Thermomanagement der 
Batterie und der elektrischen Maschine berücksichtigt. Für die gewählte Fahr- 
zeugkonfiguration und den untersuchten Zyklus wird eine mögliche Reduktion 
des Gesamtenergiebedarfs um bis zu 3.5% ermittelt. Im Rahmen der Untersu- 
chung wird dabei von einem vollständig bekannten Lastprofil ausgegangen. Das 
Thermomanagement einer elektrischen Maschine soll im Folgenden als weite- 
res Systembeispiel betrachtet werden, wobei der Fokus auf der Wechselwirkung 
mit der tatsächlichen Vorhersagbarkeit des Lastprofils liegt. 
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Generell können elektrische Maschinen in einem weiten Temperaturbereich 
betrieben werden. Bei der Regelung des Kühlsystems einer elektrischen Maschi- 
ne sind dennoch unterschiedliche Aspekte zu berücksichtigen. Die zulässige 
Betriebstemperatur hängt von der Temperaturklasse des verwendeten Isolie- 
rungsmaterials der Leiterwicklungen ab (IEC07). Dabei ist zu beachten, dass 
bereits unterhalb der kritischen Temperatur (Verlust der Isolationsfähigkeit) Al- 
terungseffekte der Isolierung auftreten, sodass die erwartete Betriebsfestigkeit 
der Maschine durch hohe Temperaturen reduziert wird (RH11). Bei permanent 
erregten Synchronmaschinen (PSM) ist außerdem die temperaturabhängige Ent- 
magnetisierung des verwendeten Magnetmaterials zu berücksichtigen. Neben 
reversibler Entmagnetisierung, kann es bei thermischer Überlastung auch zu 
irreversibler Entmagnetisierung und damit dem Ausfall der Maschine kommen 
(vgl. (Spel4, WLLO8, RKTA10)). 


Neben den thermischen Grenzbedingungen sind dabei auch die Temperaturab- 
hängigkeiten der mechanischen und elektrischen Verluste relevant. Die Verluste 
einer elektrischen Maschine lassen sich vor allem in Kupferverluste (elektri- 
scher Widerstand der Leiter), Eisenverluste (Verluste durch Ummagnetisierung 
der Stator- und Rotorbleche sowie Wirbelströme in den Blechpaketen) und 
mechanische Verluste (Reibung an Lager und Dichtungen) aufteilen. Dabei 
ergeben sich folgende grundlegende Abhängigkeiten bei steigender Temperatur: 
Die Kupferverluste steigen, die Eisenverluste und die mechanischen Verluste 
sinken (SH13). 


Bei geringen Drehzahlen und hohen Drehmomenten überwiegen im Allgemei- 
nen die Kupferverluste, wodurch sich eine eher geringe Betriebstemperatur 
empfiehlt. Mit steigender Drehzahl dominieren die Eisenverluste und die opti- 
male Betriebstemperatur steigt entsprechend an. Da bei Synchronmaschinen 
die Eisenverluste einen großen Anteil der Gesamtverluste stellen, ist dieser 
Effekt vor allem bei diesem Maschinentyp zu beachten. Generell ergibt sich 
durch die unterschiedlichen Verlusteffekte eine vom Betriebspunkt abhängige 
optimale Motortemperatur. (SH13) 


Bei Asynchronmaschinen (ASM) haben die Kupferverluste einen größeren An- 
teil an den Gesamtverlusten, wodurch sich bei kleinen Maschinen eine generell 
niedrige Betriebstemperatur empfiehlt (SH13). Mit zunehmender Leistung geht 
der Einfluss der Kupferverluste aber zurück, wodurch bei Maschinen in der 
Leistungsklasse für Fahrzeugantriebe sich ein anderer Zusammenhang erwarten 
lässt (SH13). Bei der in (Aue15) untersuchten Konfiguration mit einer ASM 
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wurde fiir die meisten Fahrzyklen - übereinstimmend mit diesen Erwartungen 
- ein höherer Wirkungsgrad bei hoher mittlerer Betriebstemperatur ermittelt. 
Für die Fahrzyklen, bei denen eine niedrige mittlere Motortemperatur zu einem 
besseren mittleren Wirkungsgrad führt, überwiegt der Kühlleistungsbedarf 
die geringeren Motorverluste, sodass auch hier eine höhere Temperatur zu 
geringerem Verbrauch führt (Auel5). 


Für Fahrzeugantriebe lässt sich daraus schließen, dass hohe mittlere Betriebs- 
temperaturen der elektrischen Maschine zu geringeren Verlusten und damit zu 
einer höheren Reichweite des Fahrzeugs führen. Dieser angestrebten hohen Mo- 
tortemperatur stehen die Alterungseffekte des Leiterisolationsmaterials und die 
Entmagnetisierung der Permanentmagnete entgegen. Ziel einer vorausschau- 
enden Regelung eines Kühlsystems einer elektrischen Maschine ist somit der 
Betrieb der Maschine in einem energieeffizienten Temperaturbereich, ohne kri- 
tische Temperaturschwellen zu überschreiten. Die optimale Betriebstemperatur 
ist hierbei vom Betriebspunkt und dem Maschinentyp abhängig. 


4.3.1 Vereinfachtes Systemmodell 


Im Folgenden wird der Kühlkreislauf einer elektrischen Maschine bestehend 
aus einem Wärmetauscher mit elektrisch betriebenem Lüfter und einer elektri- 
schen Kühlmittelpumpe als beispielhafte Systemkonfiguration betrachtet (siehe 
Abb. 4.13). 


| | | | Luftstrom 


Lüfter 


Wärmetauscher 


Pumpe 


Motor 


Abb. 4.13: Prinzipdarstellung des betrachteten Kühlsystems. 
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Zur Abbildung des Temperaturverhaltens wird das Kühlsystem vereinfacht als 
thermisches Zwei-Massen-System modelliert, bestehend aus der thermischen 
Masse des Motors und des Kühlmittels. Die (kinetische) Massenträgheit des 
Kühlsystems sowie Totzeiten durch Fließzeiten des Kühlmittels werden dabei 
vernachlässigt. Für die Temperaturänderung einer thermischen Masse gilt 
bd==, 4.10 
C (4.10) 
wobei ® die Temperatur des Körpers, C die Wärmekapazität des Körpers und Q 
die Summe aller Wärmeströme ist. Wärmeströme in Folge von Wärmestrahlung 
oder freier Konvektion an die Umgebung werden im Folgenden vernachlässigt. 


KM M 
ÒL Ûkm, CKM 


Òm, Km bm Cm | Oy 


Abb. 4.14: Zwei-Massen-Modell des Kiihlsystems mit den thermischen Massen (Temperatur 3, 
Wärmekapazität C) von Motor (M) und Kühlmittel (KM) sowie den zugehörigen Wärmeströmen 


Ò. 
Für den Motor gilt dabei 
; | „2 : 
Ou = T (Qv — Qm, Km) (4.11) 
M 


mit dem Wärmeeintrag durch die Motorverlustleistung Oy, der Wärmekapa- 
zität des Motors Cy und dem Wärmestrom Qm Km, der vom Motor an das 
Kühlmittel übertragen wird. Die Motorverlustwärme berechnet sich dabei aus 
dem Motorwirkungsgrad n und der geforderten Motorleistung Py mit 
i= 
sya A -Pu . (4.12) 
n 
Die geforderte Motorleistung Py wird wiederum aus der Radleistung Pr und 
dem mittleren Antriebstrangwirkungsgrad 14 ermittelt: 


nA (4.13) 


1. Pe falls Pe > 0, "5 
Py = 
na:Pr sonst. 
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Der Motor gibt seine Wärme an das umströmende Kühlmittel ab. Der durch 
das fließende Kühlmittel abgeführte Warmestrom Òm. Km ergibt sich als 


Òm, Km = mgm: Cp, KM (OKM A — ÜKM.E) (4.14) 


mit dem Kühlmittelmassestrom mgm, der spezifischen Wärmekapazität des 
Kühlmittels c, xm und der Temperatur des ein- und austretenden Kühlmittels 
am Motor (xm, £ bzw. Vgm a). Unter Annahme konstanter Wandtemperatur 
des Stators (große thermische Masse des Motors gegenüber der des umgeben- 
den Kühlmittels), berechnet sich die Temperaturdifferenz zwischen Ein- und 
Austritt zu 


— 4A 
Akm = Ûxm a — Ökm,E = ADu.Kmu (: —e "KM“p,KM ) ; (4.15) 


mit der Temperaturdifferenz AVm km = Vm — Vrm zwischen Motor und Kühl- 
mittel, dem Wärmeübergangskoeffizienten & sowie der Fläche A zwischen Sta- 
tor und umgebendem Kühlmedium (BS16). Die Kühlfläche der Außenmantel- 
Kühlung berechnet sich mit dem Statoraußendurchmesser Dstator und der Sta- 
torlänge stator ZU 

A=: Dstator $ [stator : (4.16) 


Für die Temperatur des Kühlmittels gilt 


OKM = Coy (Om.km — OL) (4.17) 
KM 


mit der Wärmekapazität des Kühlmittels Cx und dem über den Wärmetau- 
scher an die Umgebung abgegebenen Wärmestrom Q,. Der an die Umgebung 
abgegebene Wärmestrom berechnet sich mit der Temperaturdifferenz zwi- 
schen Kühlmittel und Umgebungsluft und der spezifischen Wärmeleistung des 
Kihlers gz zu 

ÒL = qi(Oxm — dr). (4.18) 


Die Umgebungstemperatur wird im Folgenden mit Vz, = 20°C angenommen. 
Die spezifische Wärmeleistung ist dabei vom Kühlmittelmassestrom mx jy und 


15 Zur Vereinfachung wird angenommen, dass die Antriebstrangverluste proportional zur Radleis- 
tung sind und somit bei Pr > 0 auch Py > 0 gilt. 
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dem Luftmassestrom mz durch den Kühler abhängig und wird üblicherweise 
tiber Kennfelder oder empirische Gleichungen abgebildet (Sch13). Abbildung 
4.15 zeigt ein typisches Kühlerkennfeld eines Fahrzeugkühlers mit spezifischer 
Kühlleistung über Volumenstrom des Kühlmittels und dem Massestrom der 
Kühlluft (angelehnt an (Sch13) S. 496). 


mem [kg/s] 0 0 mm kg/s] 


Abb. 4.15: Typisches Kennfeld der spezifischen Wärmeleistung ġz für Massenströme von Kühlmit- 
tel vax und Kühlluft m, eines Fahrzeugwärmetauschers. 


Die Daten der elektrischen Maschine werden entsprechend der Auslegung 
für ein sportliches E-Fahrzeug in (Grul4) gewählt (PSM). Die Maximalleis- 
tung der Maschine ist mit 153 KW angegeben. Dabei ist zu beachten, dass 
die Maximalleistung vor allem durch die thermische Belastung und den zuläs- 
sigen Strom der Leistungselektronik begrenzt ist (Füß17). Das Model S der 
Firma Tesla Motors erreicht die angegeben Fahrleistungswerte z.B. durch das 
kurzzeitige Zulassen deutlicher Überbelastungen der Maschine und Leistungs- 
elektronik (Lie16). Es wird daher im Folgenden davon ausgegangen, dass die 
Leistungselektronik höhere Ströme zulässt und durch kurzzeitige Überlastung 
der Maschine höhere Leistungen bis zu den in den Beispielfahrten geforderten 
Motorleistungen bereitstellen kann. Die thermische Masse der Maschine wird 
mit 90% der thermischen Masse eines Eisenkörpers mit den Außenabmes- 
sungen der Maschinen geschätzt. Für PSM werden in der Literatur maximale 
Wirkungsgrade von ca. 95% angegeben. Vereinfachend wird im Folgenden 
über alle Betriebspunkte mit einem mittleren Wirkungsgrad von n = 92% ge- 
rechnet. Der Wirkungsgrad von Getriebeeinheit und Differential (4) wird mit 
90% angenommen (angelehnt an (KLLS14)). Als Kühlmittel werden 10 Liter 
Wasser-Glykol-Gemisch angenommen. Die resultierenden Systemparameter 
sind in Tabelle 4.1 aufgeführt. 
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Tabelle 4.1: Parameter des vereinfachten Systemmodells. 
Statordurchmesser Dstator 189 mm 
Statorlänge = [stator 275 mm 
Wärmekapazität Motor Cy 24500 J/K 


Wärmeübergangskoeffizient «& 1900 I, (nach (BLH17)) 
spez. Wärmekap. Kühlmittel cpxy 3341 x J g (nach (Pol14)) 


Wärmekapazität Kühlmittel Cy 35000 J/K 


Das Kiihlsystem wird exemplarisch auf eine konstante Belastung mit 100 kW 
Motorleistung bei 70 km/h Fahrgeschwindigkeit und 40°C Umgebungstempe- 
ratur ausgelegt (Uy < 90°C). Der Leistungsbedarf des Kühlsystems ist von 
der Leistung der Kühlmittelpumpe und der Lüfterleistung abhängig. Sowohl 
die benötigte Pumpenleistung als auch die Lüfterleistung hängen dabei nä- 
herungsweise kubisch vom Kühlmittelvolumenstrom bzw. Luftmassenstrom 
ab (Tao16). Für einen gegebenen Sollwärmestrom Åz an die Umgebung kann 
die verbrauchsminimale Kombination aus Kühlmittelvolumenstrom und Luft- 
massenstrom ermittelt werden (Auel5). Die maximale Leistungsaufnahme 
der Pumpe wird im Folgenden mit 300 W bei maximalem Kühlmittelstrom 
(0.5kg/s) angenommen, die maximale Lüfterleistung mit 800 W. Die Erhöhung 
des Abwärmestroms durch den Lüfterbetrieb nimmt mit zunehmender Fahrge- 
schwindigkeit ab (vgl. (AGJO3)). Abbildung 4.16(a) zeigt das dimensionierte 
Kühlerkennfeld mit spez. Wärmeleistung über den Masseströmen von Kühlluft 
und Kühlmittel. Abbildung 4.16(b) zeigt die zugehörige Leistungsaufnahme 
Px von Lüfter und Kühlmittelpumpe bei optimaler Wahl des Betriebspunktes 
für eine geforderte spezifische Wärmeleistung gz bei Fahrgeschwindigkeit v. 


4.3.2 Modellprädiktive Regelung der Motortemperatur 


Das im vorherigen Abschnitt beschriebene System lässt sich als Regelsystem 
mit zwei Zustandsgrößen beschreiben, wobei die Zustände durch 


xı = Uxm , X2 = Ou (4.19) 
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(a) (b) 


Abb. 4.16: (a) Kühlerkennfeld der spezifischen Warmeleistung ġz über Massenströme von Kühlmit- 
tel vax und Kühlluft ız. (b) Kombinierter Leistungsbedarf Px von Lüfter und Kühlmittelpumpe 
bei geforderter spez. Wärmeleistung g, und Fahrgeschwindigkeit v. 


gegeben sind und somit folgende Differentialgleichung für die Systemzustände 
gilt: 


x _ dx z Cai (Om = 0) (4.20) 
x Om Tq (Qv — Qu.xm) 


wobei die beiden Systemzustände über den Warmestrom Òm xm gekoppelt 
sind. Gleichung 4.20 lässt sich in eine zeitdiskrete Übertragungsfunktion fy 
umwandeln, mit 


er 
Altı xX —— = 
yat S| slg, Ci (Om. OL) 
X1+1 X24 au (Qv — Om.m) (4.21) 
= Ss; ur, yr) R 


Stellgröße und Zielfunktion 


Für die optimalsteuerungsbasierte Regelung sollte eine Eingangsgröße gewählt 
werden, die sich möglichst gut für eine Diskretisierung des Suchraums eignet. 
In diesem Fall bietet sich die, an die Umgebung abzuführende spezifische 
Wärmeleistung an, da sie die Auslastung des Kühlsystems unabhängig vom 
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Umgebungs- und Systemzustand beschreibt. Fiir das Optimalsteuerungspro- 
blem gilt somit 
u=4qL. (4.22) 


Weiterhin muss eine Zielfunktion definiert werden, die das Sollverhalten des 
Systems beschreibt. Dabei sollen die im vorherigen Abschnitt beschriebe- 
nen Anforderungen beriicksichtigt werden. Die erste Anforderung ist die Ver- 
brauchsminimierung. Hierfür ist sowohl das temperaturabhängige Wirkungs- 
gradverhalten der elektrischen Maschine als auch der Leistungsbedarf durch 
das Kühlsystem zu berücksichtigen. In den Untersuchungen von (Auel5) wur- 
de für eine ASM in den meisten Fahrzyklen eine hohe mittlere Temperatur 
als vorteilhaft ermittelt. Da die Eisenverluste in einer PSM eine noch größere 
Rolle als bei der ASM spielen und damit die Verlustreduktion bei höherer 
Temperatur noch größer ist (vgl. (SH13)), Kann dies uneingeschränkt auf eine 
PSM übertragen werden. Aus Sicht der Effizienzanforderung ist somit eine 
hohe Motortemperatur anzustreben. 


Als Zielfunktion lässt sich — entsprechend der Folgerungen in (Aue15) - ablei- 
ten, dass der Motor bei der größtmöglichen Temperatur unter Einhaltung der 
thermischen Grenzen betrieben werden sollte. Dieses Sollverhalten wird im 
Folgenden durch eine Kostenfunktion 


J (x,U,y) = Jx(x2) + fu Ju(x,u,y) (4.23) 


abgebildet, wobei J, die von der Motortemperatur abhängigen Zustandskosten 
sind und J,, die Kosten für den Kühlleistungsbedarf J, mit einem Gewichtungs- 
faktor fu. Im Folgenden wird eine Motortemperatur von x2 = 90°C als optimale 
Betriebstemperatur angenommen. Die Kosten J, für eine Abweichung werden 
asymmetrisch (Unterschreitung der Temperatur weniger kritisch gewertet als 
Überschreitung) mit quadratischem Verlauf definiert (siehe Abb. 4.17). Die 
Kosten für den Stellaufwand werden über die erforderliche Kühlleistung Pk 
bewertet (normiert auf eine Referenzleistung Px norm). Um den geforderten Ab- 
wärmestrom und damit die geforderte Pumpen- bzw. Lüfterdrehzahl möglichst 
konstant zu halten wird ein zusätzlicher Kostenterm J, für Wechsel von u 
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Abb. 4.17: Zustandskosten J, über Motortemperatur x2 (a) und Kiihlleistungs-Kosten J, bei 
stationär eingeregelter Motortemperatur für einen beispielhaften Betriebspunkt (b). 


hinzugefügt (entsprechend Verstellkosten im Beispiel Aerodynamik). Damit 
ergeben sich die Verstellkosten zu 


1 fall F 
tosa â=] Abu. ia 


0 sonst 


Ju(x,u,y) = Pkœnv gr) 
P K norm 
Der Faktor f, und die Referenzleistung Px norm gewichten die einzusetzende 
Kühlleistung gegen auftretende Temperaturabweichungen von der Optimal- 
temperatur. Für f, = 0 wird die erforderliche Kühlleistung ignoriert und nur 
der temperaturabhängige Anteil der Kosten berücksichtigt. Das System ver- 
sucht in diesem Fall unter maximalem Einsatz der verfügbaren Kühlleistung 
die Motortemperatur so genau wie möglich auf die Optimaltemperatur einzu- 
regeln. Für fy > 0 wird ein Kompromiss aus eingesetzter Kühlleistung und 

Temperaturabweichung angestrebt. 


PI-Regler: Als Referenz für eine nicht vorausschauende Regelung wird ein PI- 
Regler eingesetzt. Dabei wird der an die Umgebung abzuführende Wärmestrom 
Q, als Steuergröße u verwendet. Für den Regler gilt somit 


. t 
up = Òr = kp(x2 Ba) Hki | alt) Bou) dt (4.25) 


mit der Motorsolltemperatur 0.77. 
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Lösung des Optimalsteuerungsproblems 


Sei Xy C R der zulässige Wertebereich des Systemzustands und U, die diskrete 
und endliche Menge aller zulässigen Steuergrößen. 


Wenn sich beim betrachteten System der Einfluss der Umgebungsgröße nicht 
auf die Zustandswechsel des Systems auswirkt, kann das Optimierungsproblem 
z.B. durch Diskretisierung des Wertebereichs des kontinuierlichen System- 
zustands vereinfacht werden (siehe z.B. (Wah15, Rad13)). Damit kann das 
System wieder als ein System mit diskreten Zuständen behandelt und das 
Lösungsverfahren aus Abschnitt 4.2.1 entsprechend angewendet werden. 


Hat die Umgebungsgröße Einfluss auf die Systemübertragungsfunktion (f; = 
f(»)), wie es bei dem hier betrachteten System der Fall ist, muss im Optimal- 
steuerungsproblem mit einer Zustandsverteilung X gerechnet werden: 


X = fo(Xr-1,Uz-1,¥r-1) , U € Ug , x EX. (4.26) 


Da der Systemzustand zu einem Zeitpunkt 7 damit durch eine Wahrscheinlich- 
keitsverteilung X7 repräsentiert ist, kann der Zustandsraum nicht ohne Weiteres 
diskretisiert werden. Dariiber hinaus ist fiir eine stochastische Vorhersage des 
Systemverhaltens auch die Verwendung einer Steuertrajektorie u als Optimie- 
rungsvariable nicht ausreichend. Vielmehr muss die Optimierungsvariable in 
diesem Fall ebenfalls eine Regelstrategie 7 (engl.: control policy) sein, z.B. in 
Form einer Folge von Regelgesetzten v;(-): 


m = {vo(-), vi(-),---,¥r—1(-)} : (4.27) 


Diese Verfahrensweise wird auch als Closed-Loop SMPC bezeichnet, da in 
diesem Fall eine explizite Rückführung der Störung innerhalb des Optimie- 
rungshorizonts berücksichtigt wird. Die Bestimmung einer solchen optimalen 
Regelstrategie z* kann aus praktischen Gesichtspunkten aber häufig nicht 
erfolgen. (May 14) 


Wird das Optimierungsproblem dennoch mit einer Steuertrajektorie als Ent- 
scheidungsvariablen gelöst, spricht man auch von Open-Loop SMPC. Die 
Anwendung dieser (Open-Loop) Steuertrajektorie kann jedoch zu abweichen- 
dem (suboptimalem) Verhalten im geschlossenen Regelkreis führen. Da sich 
im Optimierungsproblem aus der Steuertrajektorie eine Verteilung möglicher 
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Zustände X ergibt, kann die Anwendung im geschlossenen Regelkreis zu einer 
unnötig konservativen Zustandstrajektorie führen (Wei09). Unter gewissen 
Voraussetzungen (z.B. signifikantes Messrauschen) kann diese Open-Loop 
Steuertrajektorie aber zu besseren Resultaten als eine Closed-Loop Steuerstra- 
tegie führen (Wei09). Weiterhin ist die Open-Loop Strategie praktikabel, wenn 
die Streuung des Zustands verhältnismäßig klein ist (stabiles Systemverhalten) 
und keine Zustandsbeschränkungen vorliegen (May14). Im Folgenden wird 
daher die Lösung des Optimalsteuerungsproblems über eine Steuertrajektorie u 
beschrieben. 


Zur exakten Lösung des stochastischen Optimalsteuerungsproblems aus Gl. 
(4.1) muss ein 7-schrittiger Suchbaum über die möglichen Steuerwerte durch- 
sucht werden. Dabei ergibt sich ein exponentieller Zusammenhang zwischen 


der Mächtigkeit der Steuermenge U, und der Anzahl der Suchknoten mit 
T 
|Ual'. Eine effiziente Strategie zur Auswertung des Suchbaums, die das Auf- 
t=1 
finden der optimalen Lösung garantiert, ist die Uniform-Cost-Search (UCS). 


Uniform-Cost-Search: UCS ist eine einfache Strategie, den optimalen Pfad 
eines Suchbaums zu finden. Ausgehend vom Startknoten des Suchbaums (xo), 
werden alle möglichen Nachfolger der offenen Liste hinzugefügt und deren 
Pfadkosten V; ermittelt. Anschließend wird jeweils der Knoten expandiert, 
der die geringsten Pfadkosten aufweist und die möglichen Nachfolger dieses 
Knotens werden der offenen Liste hinzugefügt. Expandierte Knoten werden 
aus der offenen Liste entfernt. Der optimale Pfad mit minimalen Kosten ist 
gefunden, sobald ein Knoten der letzten Suchebene (t = T) expandiert wurde. 
Die Komplexität der Uniform-Cost-Search ist dabei von der Struktur der Kos- 
tenfunktion abhängig. Im schlechtesten Fall werden alle Knoten expandiert und 
der gesamte Suchbaum muss durchlaufen werden. Im besten Fall wird aber nur 
der optimale Pfad expandiert. Siehe hierzu z.B. (RNO9). Somit garantiert UCS 
zwar die Optimalität der gefundenen Lösung, der benötigte Rechenaufwand 
ist aber stark von den Eigenschaften des Systems und den Randbedingungen 
abhängig. 


Heuristische Uniform-Cost-Search: In (Wah15) wird ein heuristisches Prin- 
zip zur Reduktion des Suchraums für kontinuierlichwertige Systemzustände 
mit dynamischer Programmierung beschrieben. Eine ähnliche Heuristik lässt 
sich auch in die steuergrößenorientierte Formulierung der Uniform-Cost-Search 
übertragen. Da für die Systemübertragungsfunktion die Markov-Eigenschaft 
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Abb. 4.18: Schematische Darstellung des Suchraums der Uniform-Cost-Search (expandierte Knoten 
in schwarz) über einen Optimierungshorizont T mit Startzustand xo, Steuergröße u und optimalem 
Zustandsverlauf x* mit Kosten V*. 


vorausgesetzt wurde, kann unter Annahme einer lokalen Konvexität der Kos- 
tenfunktion eine Bevorzugung von lokal optimalen Zuständen zur Reduktion 
des Suchraums eingesetzt werden. 


Um diese lokale Konvexität auszunutzen, wird der zulässige Zustandsraum in 
Nm Bereiche aufgeteilt und jeweils nur der in diesem Bereich beste Zustand 
weiterverfolgt. Die heuristisch beschränkte Suche lässt sich dann wie folgt 
formulieren: Sei 

Am C Xk m E [1, Nm], (4.28) 


eine Aufteilung des Zustandsraums A% in Nm Submengen, dann wird jeweils 
nur die Expansion eines Knotens aus der Submenge Xn zugelassen. Für eine 
deterministische Vorhersage ¥ ist dem Suchknoten ein Zustand x zugeordnet. 
Der Zustand x wird der Submenge m zugeordnet, wenn x € Xn gilt. Wird eine 
stochastische Vorhersage 7 verwendet, ist dem Knoten eine Sample-Verteilung 
X zugeordnet. Die Submenge wird dann über den Erwartungswert bestimmt. 
Für die Zuordnung gilt somit 


X> m: E(X) € An. (4.29) 
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Bei ausreichend feiner Diskretisierung N, kann für lokal konvexe Kostenfunk- 
tionen so eine deutliche Reduktion des Suchraums erreicht werden. Dabei wird 
die maximale Anzahl an expandierten Knoten durch die Heuristik auf Nn -T 
begrenzt, womit eine lineare Abhängigkeit der Suchknoten von der Anzahl 
der Zeitschritte des Optimierungsproblems existiert. Dieses Verfahren wird 
im Folgenden als Heuristic-Uniform-Cost-Search (HUCS) bezeichnet. Der 
Suchraum von HUCS ist in Abb. 4.19 schematisch dargestellt. 


Amt 1 


aT 


Abb. 4.19: Schematische Darstellung des Suchraums der heuristischen Uniform-Cost-Search für 
ein System mit unsicheren Zustandsübergängen. x9: Startzustand; u: Stellgröße; Xm: heuristische 
Diskretisierung des Zustandsraums; xg: Sample k einer Zustandsverteilung; E(Xx ): Erwartungswert 
einer Zustandsverteilung aus K Samples; x*: Optimaler Zustandsverlauf mit Kosten V*. 


Da UCS nur begrenzt für echtzeitfähige Anwendungen in Betracht kommt, wird 
für das vorausschauende Thermomanagement die heuristische Einschränkung 
des Suchraums angewendet. Dafür wird der Zustandsraum in Nm Bereiche 
aufgeteilt. Da das System zwei Zustandsvariablen hat, wird für jeden dieser 
Zustände eine Diskretisierung eingesetzt: Seien A m und Xz m Submengen des 
erreichbaren Zustandsraums mit 


Xim G Nk ‚me [L, Nm] 
Xan C Ak ‚Ne (1, Nm] (4.30) 
mit xı € Ay k, X2 E Kay, 
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eine Aufteilung des Zustandsraums in Nm, X Nm Submengen, dann wird je- 
weils nur die Expansion eines Knotens im Zustandsraum X1 m X X2 zugelas- 
sen. Dabei gilt für die Zuordnung der Submengen 


x> [m,n] :xı € Xim, X2 E Xan (4.31) 


bei deterministischem Zustand x bzw. 


X > [m,n] : E(x1) € Xim , E(x2) € Xan (4.32) 


bei einer Zustandsverteilung X. 


Abbildung 4.20 zeigt die resultierenden Suchräume mit UCS und HUCS für 
eine beispielhafte Situation, wobei Nm, ‚Nm, = 5 gewählt wurde. Der Such- 
baum ist für T = 15 Zeitschritte dargestellt. Die optimierten Zustandsverläufe 
x* sind für beide Verfahren fast identisch. Da HUCS aber nicht die Optima- 
lität der Lösung garantiert, unterscheiden sich die resultierenden Steuer- und 
Zustandsverläufe geringfügig. Die Anzahl der ausgewerteten Suchknoten ist 
bei Einsatz der Heuristik signifikant kleiner (189 Auswertungen für HUCS 
gegenüber 3283 für UCS). 


4.3.3 Vergleich Pl-Regler und MPC 


Um den Unterschied zwischen vorausschauender (MPC) und konventioneller 
Regelung (PI) zu verdeutlichen, wird zunächst das Regelverhalten von MPC 
mit idealer Vorausschau (Vorausschauhorizont T = 30s) und möglichen Kon- 
figuration des PI-Reglers verglichen. Hierfür werden die Reglerparameter kp 
und k; systematisch variiert, um die realisierbaren Zielerreichungen der nicht 
vorausschauenden Regelung zu analysieren. Für eine Fahrt werden die jeweili- 
gen Zielerreichungen bezüglich der Zustands- und der Stellkosten ermittelt (Ry 
bzw. R,), mit 


N 
Ry = VI) > 
t=0 


N (4.33) 


Ru= Ju, u, y1) . 
t=0 
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Abb. 4.20: Resultierender Steuervektor u, Verlauf von Kühlmitteltemperatur x; und Motortempera- 
tur x2 für den Suchraum bei Verwendung von UCS (a) und der heuristisch eingeschränkten Suche 


mit HUCS (b). (-)*: Bester gefundener Pfad; (-)*: Expandierte Knoten; (-)°: Knoten der offenen 
Liste. 
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Abb. 4.21 zeigt diese Zielerreichungen fiir die vorausschauende Regelung mit 
idealer Vorhersage gegen die möglichen paretooptimalen Konfigurationen des 
PI-Reglers für einen dynamischen Fahrer (a) und einen ruhigen Fahrer (b). 


1000 


(a) (b) 


Abb. 4.21: Pareto-Front der erzielbaren Regelgüte (Zielerreichung für Zustandskosten Ry über 
Stellkosten R„) mit unterschiedlichen Konfigurationen des PI-Reglers und MPC (Vernachlässigung 
der diskreten Wechselkosten Jug für Vergleichbarkeit) bei idealer Vorhersage für Fahrer A (a) und 
B (b). 


Der Regelaufwand (Ry + R,,) ist offensichtlich von der Fahrweise abhängig und 
für den dynamischen Fahrer deutlich höher. In beiden Fällen zeigt sich aber, 
dass die vorausschauende Regelung eine bessere kombinierte Zielerreichung 
ermöglicht, als durch Variation der PI-Regelparameter möglich ist. Dies ver- 
deutlicht, dass durch den MPC-Ansatz eine geringere Regelabweichung (Ry) 
unter geringerem Regelaufwand (R,,) erreichbar ist. 


Abbildung 4.22 zeigt den Vergleich der Zustands- und Regelgrößen für den 
dynamischen Fahrer. Durch die sprunghaften Anstiege in der Leistungsanfor- 
derung kommt es zu einem ebenso sprunghaften Anstieg des Wärmeeintrags in 
das Kühlsystem. Der PI-Regler erhöht die auszukoppelnde Wärmeleistung erst 
nach einer steigenden Abweichung der Motortemperatur x2, was zu deutlichen 
Temperaturspitzen führt. Mit der vorausschauenden Regelung wird bei rele- 
vanten Leistungsphasen bereits vor oder zu Beginn der Leistungsanforderung 
die Wärmeauskopplung erhöht, um dem bevorstehenden Temperaturanstieg 
entgegenzuwirken. Die Spitzentemperaturen können dadurch entsprechend 
reduziert werden. 
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Abb. 4.22: Temperaturverläufe von Kühlmittel x; und Motor xz für die Regelung mit dem MPC- 
Ansatz (ideale Vorhersage) und dem PI-Regler bei einem dynamischen Fahrer. 


Abb. 4.23 zeigt die entsprechenden Zustände für den ruhigen Fahrer. Hier zei- 
gen sich ähnliche Charakteristiken wie bei dem dynamischen Fahrer. Durch die 
deutlich weniger dynamischen Leistungsanforderungen sind die auftretenden 
Temperaturschwankungen aber deutlich geringer ausgeprägt. Die Motortem- 
peratur kann somit von beiden Verfahren mit geringerer Abweichung von der 
Idealtemperatur (x2 = 90°C) geregelt werden. 
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Abb. 4.23: Temperaturverläufe von Kühlmittel x; und Motor x2 für die Regelung mit dem MPC- 
Ansatz (ideale Vorhersage) und dem PI-Regler bei einem ruhigen Fahrer. 


Diese Beispiele zeigen, dass die nicht vorausschauende Regelung deutlich 
schlechter auf sprunghafte Wechsel in der Leistungsanforderung reagieren 
kann, wodurch ungewollte Temperaturspitzen oder unnötig hoher Kühlaufwand 
entstehen können. Mit vorausschauender Regelung kann mit vergleichsweise 
geringem Kühlaufwand eine geringere Regelabweichung erzielt werden. Wie 
die vorausschauende Regelung mit realen statt der idealen Vorhersage reagiert, 
wird im nächsten Abschnitt behandelt. 
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4.3.4 Ergebnisse mit Realfahrten 


Nachdem zuvor die ideale Vorhersage zur Bestimmung der Lésung des Opti- 
malsteuerungsproblems verwendet wurde, werden im Folgenden die Resultate 
mit den behandelten Vorhersagemodellen SP,,-, SP, und MK für alle Fahrten er- 
mittelt. Die zugehörigen Zustandsverläufe werden erneut mit Xsp,.» Xsp,» XsPyx 
und Usp... Usp,» Usp,,, bezeichnet, die Regelgüte entsprechend mit Rsp,,,,Rsp, 
und Ryx. Die Vorhersagen werden entsprechend Abschnitt 3.8.4 mit einem 
Initialisierungslauf zur Parameterschätzung, einer Sample-Größe K = 10 und 
einem Vorausschauhorizont von T = 30s berechnet. 


Bekannte Strecke: Zunächst wird von einer bekannten Routenführung für 
die auf Streckendaten basierenden Modelle ausgegangen. Abbildung 4.24 
zeigt die mittlere Regelgüte sowie die Verteilung über alle Fahrer (normiert 
auf die mittlere Regelgüte Rop). Die beiden auf Streckendaten basierenden 
Modelle erzielen eine vergleichbare Regelgüte, die vergleichsweise wenig von 
der Regelgüte mit idealer Vorhersage abweicht. Die Markov-Kette schneidet 
signifikant schlechter ab. 


1.6 4 

5 3 x T 

S 1.4 = 3 x 
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Abb. 4.24: Erzielte Regelgiite (normiert auf die mittlere optimale Regelgüte Rop) für die unter- 
schiedlichen Vorhersagemodelle, gemittelt über alle Fahrer. (a) Mittlere Regelgüte R, (b) Box- 
Whisker-Plot von R mit Median, Interquartilbox und Maximal- bzw. Minimalwerten. 


Abbildung 4.25 zeigt die Verteilung der erzielten Zustandskosten R, und Stel- 
laufwände R, für alle Fahrer und Vorhersagemodelle. Die Darstellung zeigt, 
dass die erzielten Zustandskosten für die Vorhersagemodelle vergleichbar sind. 
Die schlechtere Regelgüte mit den Vorhersagen der Markov-Kette resultiert 
folglich aus dem deutlich höheren Stellaufwand R,,. Der Nachteil der weniger 
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scharfen Vorhersagen resultiert vor allem in einem höheren Stellaufwand zur Er- 
reichung des Regelziels. Weiterhin zeigen sich geringfügig höhere Stellkosten 
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Abb. 4.25: Für die jeweiligen Testfahrten erzielten Zustandskosten J, über Verstellkosten J, für die 
unterschiedlichen Vorhersagemodelle. 


R, für die stochastische Vorhersage SP,,. im Vergleich zur Punktvorhersage SP,. 
Dies entspricht dem erwarteten Verhalten der Open-Loop Lösung des stochasti- 
schen Optimalsteuerungsproblems im geschlossenen Regelkreis (siehe auch 
(Wei09)). Durch die Open-Loop Lösung kommt es zu einer Überschätzung der 
Unsicherheit in den resultierenden Systemzuständen x, was in einer tendenziell 
zu hohen Temperaturreserve und damit einem leicht erhöhten Kühlaufwand 
resultiert. Bei der Punktvorhersage SP, tritt dieser Effekt nicht auf. Durch im 
Mittel etwas geringere Zustandskosten ist die mittlere Zielerreichung für SP, 
und SP. aber fast identisch. Eine Closed-Loop Lösung des stochastischen 
Optimalsteuerungsproblems würde hier eventuell besser abschneiden und die 
Regelgüte für SP,. gegenüber SP, verbessern, kann aber nicht ohne weiteres 
ermittelt werden. 


Die resultierenden Systemzustände für eine beispielhafte Autobahnauffahrt sind 
in Abbildung 4.26 für die Vorhersagemodelle SP,,- und MK dargestellt. Der 
Vergleich des abgeführten Wärmestroms Ò; zeigt, dass mit der auf Strecken- 
daten basierenden Vorhersage bereits vor der Beschleunigungsphase Wärme 
aus dem System abgeführt wird, um die Motortemperatur x2 abzusenken. Mit 
der Markov-Kette wird die Temperatur in dieser Phase konstant gehalten. Bei 
Eintritt der Radleistungsforderung (t ~ 1615s) kann durch die Absenkung 
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Abb. 4.26: Verläufe von Motortemperatur x2, Wärmestrom ÒL, kumulierte Gütemaße J, und J, 
(normiert auf den jeweiligen Endwert mit der Vorhersage MK) sowie Geschwindigkeit v und 
Radleistung Pr für eine beispielhafte Autobahnauffahrt. Die Zustandsverläufe sind jeweils bei 
Verwendung der Vorhersagen SP,,. (blau), SP, (grün) und MK (rot) dargestellt (bekannte Strecke 


für SP. und SP,). 
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der notwendige Stellaufwand reduziert und die auftretende Temperaturspitze 
verringert werden. Die kumulierten Gütemaße J, und J, (normiert auf den 
jeweiligen Endwert mit der Vorhersage MK) zeigen, dass bei Verwendung von 
SP. eine bessere Zielerreichung für diese Situation realisiert werden kann. 
Bei Verwendung der Punktvorhersage SP, entspricht das Verhalten in diesem 
Fall im Wesentlichen dem bei Verwendung der Verteilungsvorhersage SPyc- 
Die resultierenden Strategien und Zustandsverläufe unterscheiden sich nur 
marginal. 


Unbekannte Strecke: Wie im vorangegangenen Beispiel werden auch für 
das Thermomanagement die Ergebnisse mit unbekannter Routenführung für 
die auf Streckendaten basierenden Modelle berechnet. Abbildung 4.27 zeigt 
den Vergleich für eine Beispielsituation bei Verwendung der stochastischen 
Vorhersage SP,,, und der Punktvorhersage SP,. Die Situation zeigt, dass die 
Punktvorhersage ohne Kenntnis der Strecke den bevorstehenden Leistungsein- 
trag später erfasst und im System so höhere Spitzentemperaturen auftreten, als 
bei Verwendung der Verteilungsvorhersage. 


Bei Betrachtung der mittleren Regelgüte über alle Fahrer (Abbildung 4.28) 
bestätigt sich dieser Zusammenhang. Die erzielte Regelgüte verschlechtert 
sich zwar für beide Vorhersagemodelle, im Vergleich zu den Ergebnissen 
bei bekannter Strecke. Für die Punktvorhersage nimmt die Regelgüte jedoch 
stärker ab. Die stochastische Vorhersage schneidet in Summe besser ab. In 
Abb. 4.29 ist zusätzlich die Verteilung der Stell- und Zustandskosten R,, und 
R, für die einzelnen Fahrer dargestellt. Diese Darstellung zeigt nochmals, 
dass die Verschlechterung der Punktvorhersage vor allem auf den Fahrten mit 
hohem Regelaufwand (R = R, +R,,) basiert. Im Fall der unbekannten Strecke 
überwiegen somit die Vorteile der stochastischen Vorhersage, die auch mehrere 
Routenverlaufsoptionen in die Strategie mit einbeziehen kann, während die 
Punktvorhersage sich für eine Verlaufsoption entscheiden muss. 


4.3.5 Fazit 


Das Systembeispiel des vorausschauenden Thermomanagements einer elektri- 
schen Maschine bestätigt ebenfalls die Überlegenheit der auf Streckendaten 
basierenden Vorhersagemodelle gegenüber der reinen Zeitreihenmodellierung. 
Unter den auf Streckendaten basierenden Vorhersagen schneidet die stochasti- 
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Abb. 4.27: Verläufe von Motortemperatur x2, Wärmestrom ÒL, kumulierte Gütemaße Jy und J, 
(normiert auf den jeweiligen Endwert mit der Vorhersage SP,) sowie Geschwindigkeit v und 
Radleistung Pr für eine beispielhafte Autobahnauffahrt. Die Zustandsverläufe sind jeweils bei 
Verwendung der Vorhersagen SPinc (blau), SP, (grün) ohne Kenntnis der Route dargestellt. 
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Abb. 4.28: Erzielte mittlere Regelgüte R (normiert auf mittlere optimale Regelgiite R,,,) für die auf 
Streckendaten basierenden Vorhersagemodelle bei bekannter und unbekannter Strecke, gemittelt 
über alle Fahrer. 
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Abb. 4.29: Für die jeweiligen Testfahrten erzielte Regelgiite fiir Zustandskosten Ry über Verstell- 
kosten R, für die auf Streckendaten basierenden Modelle bei unbekannter Routenführung. 


sche Vorhersage SP,,. auch für dieses Systembeispiel besser ab als die Punkt- 
vorhersage SP,, insbesondere wenn die Fahrtstrecke nicht im voraus bekannt 
ist. Dabei ist jedoch zu beachten, dass das stochastische Optimalsteuerungs- 
problem über eine optimale Steuertrajektorie u* gelöst wurde und somit eine 
Open-Loop-Strategie über den Optimierungshorizont darstellt. Bei Implemen- 
tierung einer Closed-Loop-Strategie ist tendenziell nochmals eine Verbesserung 
der Regelstrategie für die Verteilungsvorhersage zu erwarten. 
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Ausblick 


Vorausschauende Regelansätze haben das Potential, eine intelligentere Steue- 
rung von Fahrzeugsystemen bzw. die Darstellung neuer Funktionalitäten für 
Fahrzeugsysteme zu ermöglichen. Die Vorhersagbarkeit der dafür notwendigen 
Größen und der Einfluss der Unsicherheit spielen dabei eine wichtige Rolle für 
die vorausschauende Regelung. In dieser Arbeit wurde das Zusammenspiel von 
Fahrerverhalten, Vorhersagen und der vorausschauenden Regelung an mehreren 
Systembeispielen systematisch untersucht. Die Ergebnisse und Implikationen 
sind im Folgenden nochmals aufgeführt. 


Grundsätzlich kommen unterschiedliche Vorhersagemethoden für die Erzeu- 
gung der benötigten Information in Frage. Neben klassischen Zeitreihenmo- 
dellen ermöglichen die vorhandenen Umfelddaten auch modellbasierte Vor- 
hersagen unter Einbeziehung der Umgebungsinformationen. In dieser Arbeit 
wurde hierfür eine Methode zur Modellierung des Fahrerverhaltens vorgestellt, 
die stochastische Vorhersagen basierend auf Streckendaten ermöglicht. Dabei 
wurden die Online-Schätzung der benötigten Parameter und die Vorhersage 
der resultierenden Verteilungen mittels Monte-Carlo-Approximation behan- 
delt. Zur Verifizierung und Validierung des Vorhersagemodells wurden sowohl 
künstlich generierte als auch real aufgezeichnete Daten eingesetzt. 


Zur Bewertung der Monte-Carlo-Vorhersagen wurden verschiedene geeignete 
Bewertungsmetriken ermittelt. Um die Vorhersagegüte des vorgestellten Mo- 
dells in Relation zu stellen, wurden weitere gängige Methoden zur Erzeugung 
von Vorhersagen als Referenz eingesetzt. 


Die Bewertung der Modelle hat dabei ergeben, dass die auf Zeitreihen basieren- 
de Modellierung mit einer Markov-Kette eine leichtere statistische Kalibrierung 
der Vorhersagen ermöglicht, da die Unsicherheit direkt erfasst werden kann 
und nicht von einer Modellierung oder Parametrierung abhängt. Diese Art der 
Modellierung tendiert dabei aber zu unspezifischen und wagen Vorhersagen, die 
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wenig situationsspezifische Informationen enthalten. Die auf Streckendaten ba- 
sierenden Modelle haben einen prinzipbedingt höheren Modellierungsaufwand 
und sind nicht zwangsläufig vollständig (Erfassung aller Einflüsse). Im Gegen- 
satz zu Zeitreihenmodellen sind sie jedoch in der Lage, deutlich informativere 
und präzisere Vorhersagen zu treffen. Das Einbeziehen von Unsicherheiten hat 
sich auch bei einer auf Streckendaten basierenden Vorhersage als vorteilhaft 
erwiesen. Das vorgestellte stochastische Framework konnte ingesamt die bes- 
ten Vorhersageergebnisse erzielen. Bei der Punktvorhersage mit Streckendaten 
und der stochastischen Vorhersage mit Zeitreihenmodellierung (Markov-Kette) 
unterscheiden sich die Resultate je nach angewendeter Bewertungsfunktion 
(lineare oder quadratische Gewichtung des Fehlers). 


Um Verteilungsvorhersagen zur vorausschauenden Steuerung von Systemen 
einzusetzen, muss ein stochastisches Optimalsteuerungsproblem gelöst werden. 
In dieser Arbeit wurden Lösungsansätze für ein System mit diskreten Zustän- 
den (Aerodynamik), sowie ein System mit kontinuierlichen Systemzuständen 
(Thermomanagement) diskutiert. Für das System mit diskreten Zuständen 
wurde das Problem dabei mit dynamischer Programmierung gelöst. Bei dem 
System mit kontinuierlichen Systemzuständen wurde eine heuristisch erweiter- 
te Baumsuche angewendet, die die effiziente Lösungsfindung für diesen Fall 
ermöglicht. Die Lösungsverfahren wurden an den beispielhaften Systemanwen- 
dungen in einer Simulation implementiert. Dabei wurden die zuvor behandelten 
Vorhersagemodelle zur Erzeugung der benötigten Vorausschauinformationen 
eingesetzt und hinsichtlich ihrer Eignung bewertet. 


Die vorgestellte vorausschauende Regelung der aktiven Aerodynamik ermög- 
licht dabei die Anpassung der Fahreigenschaften nach den Gesichtspunkten des 
Energieverbrauchs und der fahrdynamischen Anforderungen an die jeweilige 
Fahrsituation. Es konnte gezeigt werden, dass eine solche fahrsituationsgerech- 
te Steuerung mit einer Trajektorienvorhersage erreicht werden kann. Durch 
die Berücksichtigung von Unsicherheiten in der Vorhersage und dem Optimal- 
steuerungsproblem kann dabei eine robuste Regelstrategie umgesetzt werden, 
während es bei der Anwendung von Punktvorhersagen zu häufigeren Ument- 
scheidungen durch Abweichungen von der Vorhersage kommen kann. Ohne 
Verwendung von Streckendaten konnte die fahrsituationsgerechte Steuerung 
nur eingeschränkt erreicht werden, da besonders die Querdynamikeinflüsse 
nicht mit ausreichendem Reaktionszeit vorhergesagt werden konnten. 
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Als zweite Systemanwendung wurde das vorausschauende Thermomanagement 
einer elektrischen Antriebsmaschine vorgestellt. Die vorausschauende Rege- 
lung gewährleistet dabei die effiziente Begrenzung der Motortemperatur auf 
einen vorgegebenen Temperaturbereich unter Berücksichtigung der aktuellen 
und zukünftigen Umbegungsbedingungen. Temperaturspitzen in der elektri- 
schen Antriebsmaschine können dabei durch ein vorausschauendes Absenken 
von Motor und Kühlmitteltemperatur vermieden werden. 


Für beide Systemanwendungen haben sich die auf Streckendaten basieren- 
den Vorhersagen als geeigneter erwiesen. Die unspezifischen Vorhersagen der 
Markov-Ketten, wie sie für stochastische MPC in der Literatur häufig eingesetzt 
wurden, resultierten trotz statistisch besserer Kalibrierung in einigen Fällen 
in einer nur ungenügenden Zielerreichung der vorausschauenden Regelung. 
In allen Fällen waren die Ergebnisse schlechter, als bei Verwendung der auf 
Streckendaten basierenden Modelle. Unter den auf Streckendaten basierenden 
Vorhersagemodellen zeigte sich auch hinsichtlich der angestrebten Regelziele 
in Summe ein besseres Ergebnis mit der Verteilungsvorhersage. 


Das vorgestellte Framework zur Erzeugung stochastischer Vorhersagen eröffnet 
zahlreiche weitere Handlungsfelder. So könnte beispielsweise die Erweiterung 
der Fahrer- und Umfeldmodellierung um zusätzliche Informationen über andere 
Verkehrsteilnehmer oder Ampeln und Haltestellen zu einer vollständigeren Mo- 
dellierung der Transferfunktion und potentiell besseren Vorhersagen beitragen. 
Die Modellierung wurde im Rahmen dieser Untersuchung auf die wichtigsten 
Einflüsse begrenzt, um eine Behandlung der vollständigen Methodenkette von 
der Fahrermodellierung über die Parameterschätzung und Vorhersage bis zur 
vorausschauenden Steuerung zu ermöglichen. Bei entsprechender Verfügbar- 
keit von umfangreichen Messdaten mit unterschiedlichen Fahrern und Strecken 
könnten tiefer gehende Untersuchungen bezüglich der unterschiedlichen Mo- 
dellierungsaspekte erfolgen. 


Die prinzipielle Eignung und Umsetzbarkeit vorausschauender Regelansät- 
ze in Kombination mit stochastischen Vorhersagen für verbesserte und neue 
Funktionalitäten für Fahrzeugsysteme konnte in dieser Arbeit nachgewiesen 
werden. Die stochastische Formulierung hat für beide betrachtete Systeme, 
trotz der völlig unterschiedlichen Systemeigenschaften, zu einem verbesserten 
Regelverhalten gegenüber einer Formulierung ohne die Unsicherheiten geführt. 
Zahlreiche weitere Anwendungsmöglichkeiten sind somit denkbar und die 
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erarbeitete Methode eröffnet Raum für weiterführende Untersuchungen, an den 
vorgestellten oder anderen Anwendungsbeispielen. 
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A.1 Messfahrten 
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Uberland Stadt Autobahn 


v [m/s] 


s [km] 


Abb. A.1: Geschwindigkeit v, Längsbeschleunigung ay, Querbeschleunigung ay und Radleistung 
Pr über der Strecke s für alle aufgezeichneten Testfahrten. 
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a, [m/s?] 


v m/s] 


Abb. A.2: Relative Häufigkeitsverteilung h der Kombinationen aus Längsbeschleunigung a, und 
Fahrgeschwindigkeit v über alle Fahrten. 
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Abb. A.3: Relative Häufigkeitsverteilung h der Kombinationen aus Querbeschleunigung ay und 
Fahrgeschwindigkeit v über alle Fahrten. 
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Abb. A.4: Relative Häufigkeitsverteilung h der Kombinationen aus Querbeschleunigung a, und 
Längsbeschleunigung a, über alle Fahrten. 


A.2 Zeitdiskrete Auswertung der 
Fahrzeugbewegungsgleichung 


Die zeitdiskrete Berechnung der Fahrzeugbewegung erfolgt mit einem Zeit- 
schritt At = 1s. Dabei wird von einem stückweise konstanten Ruck ausgegan- 
gen. Für eine Zielbeschleunigung ax, kann mit 


r axt — Axt-1 
= n A.l 
Jt At (A.1) 


der notwendige Ruck zur Erreichung der Zielbeschleunigung innerhalb von 
einer Sekunde ermittelt werden. Für die Geschwindigkeit v; gilt dann 


1 
Vp = Vy-1 + yp At + Zar 
(A.2) 


1 
= v1 +5 (tay aes) 
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Die neue Fahrzeugposition berechnet sich entsprechend zu 


1 
St = St—1 tv, At + dy ,—1At? a Ar 
6 (A.3) 


Axt-1 Axt 2 
z -1+v-14r+ ( St) ar. 
St—1 Vt-1 3 + 6 


Die Querbeschleunigung ermittelt sich aus der Straßenkrümmung «K (s+) an der 
Fahrzeugposition und der Geschwindigkeit mit 


ayı =v; + K (51). (A.4) 
Die Radleistung ergibt sich aus dem Fahrwiderstandsmodell und wird durch 
Pri = Fy .(-) “Vt (A.5) 


berechnet. 


A.3 Stationäre Verteilung und mittlere 
Zustandsaufenthaltszeiten einer 
Markov-Kette 


Stationäre Verteilung: Eine charakteristische Eigenschaft einer Markov-Kette 
bzw. ihrer Übergangsmatrix M ist die stationäre Verteilung. Die stationäre 
Verteilung Tə ist dadurch charakterisiert, dass sich die Zustandsverteilung 
ausgehend von der stationären Verteilung im Zeitverlauf nicht ändert. Für die 
stationäre Verteilung gilt somit die Bedingung 


nl-M =T}. (A.6) 


Diese stationäre Verteilung (sofern existent) ist von besonderem Interesse, da 
sie auch den Erwartungswert für die Zeitanteile beschreibt, zu denen sich die 
Markov-Kette in den jeweiligen Zuständen aufhält. Die stationäre Verteilung 
kann über das Lösen eines linearen Gleichungssystems bestimmt werden (vgl. 
(CWKH* 13)). 
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Zustandsaufenthaltszeiten: Die Wahrscheinlichkeit, dass die Markov-Kette 
einen Zustand i nach einem Zeitschritt verlässt beträgt 


Pia = (1— pi), (A.7) 


mit der Zustandsübergangswahrscheinlichkeit p; = P(S; = i|S;-1 = i). Die 
Wahrscheinlichkeit, dass die Markov-Kette den Zustand i nach n Zeitschritten 
verlässt, im Folgenden p; n bezeichnet, beträgt dann entsprechend 


Pin = pl (1—pii) - (A.8) 


Die mittlere Aufenthaltsdauer in Zeitschritten fiir den Zustand i ergibt sich 
dann mit 


S| 
| 
Ms 
x 
S 


3 
ll 
psi 


(A.9) 
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A.4 Rekursive Schätzung von Mittelwert und 
Varianz 


Im Folgenden wird die rekursive Schätzung von Mittelwert und Varianz einer 
Zeitreihe entsprechend der Verfahrensweise von (Wel62) beschrieben. Der 
arithmetische Mittelwert von n Beobachtungen der Zeitreihe x berechnet sich 
zu 


En = — DR (A.10) 


und ist gleichzeitig der Schätzwert für den Erwartungswert u der Verteilung X, 
falls x; «X. 
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A.5 Rekursive Schätzung von Parametern eines AR(1)-Modells 


Diese Berechnungsvorschrift kann durch 


1 n 


x > X= 1 + py |=] nant 


in eine rekursive Form gebracht werden. 


—1 
Xn-1 (A.11) 


Die Varianz o° der Verteilung wird über die korrigierte Stichprobenvarianz s2 
geschätzt: 


ô? = hes in). (A.12) 


Auch hier ist eine Umformung in eine rekursive Berechnungsvorschrift mög- 
lich: 


1 n 
ne 
1 n—1 _ 1 E 2 
en] 
—1 
ren 7 (na) (A.13) 
n 
1 ».[ı,.@a-ı) j 
= at by Fe) ++ z (Xp —Xn—1) 
n—2 
= et „en &n-1) 


Diese rekursiven Berechnungsvorschriften sind exakt und numerisch stabil 
(CGL83). 


A.5 Rekursive Schätzung von Parametern 
eines AR(1)-Modells 


Gegeben ist der AR(1)-Prozess 


Xr = Pxr-1 +E , & œ N (0,02) . (A.14) 
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Die Berechnung der echten Maximum-Likelihood-Schätzwerte für @ und o2 
kann nicht analytisch erfolgen und muss durch iterative numerische Proze- 
duren ermittelt werden (SS11). Sie eignen sich daher nicht für eine Online- 
Implementierung. Stattdessen können aber die ML-Schätzwerte bedingt auf 
die erste Beobachtung, auch CML-Schätzwerte genannt, verwendet werden. 
Der CML-Schätzwert für @ berechnet sich nach (SS11) mit 


È œ =E) (x-1 E) 
ML _ = l (A.15) 


L (x-1 x)? 


t=2 


Zunächst folgt: 


n n 
E (e= Kn) (x11 En) E (8-1 — m -n-ı +) 


oo — t=2 _= 
n x ee — x) (n = Di, 
t=2 
n 
(Ea) Xn (nXp xı) Xn (n Tizi + (n — ix (A.16) 
(n=2)s7 4 


1 2 l = =z =2 
n—1 ( L aaa) Tin T n_1*nX1 XnXn—1 + Xn 
t 


u n—2 02 
= 


“Ts 


n—1 1 


Sei weiter 
. Ve 2 
n= — Yax-ı,n>2, (A.17) 
HZ E) 


mit folgender rekursiven Berechnungsvorschrift: 


san 1 n 
2i = y XtXt—1 
n=15 
n—1 
za > 1) + M (A.18) 

n-1\5 n—l1 

ze 
f A t KnXn=1% 
n—1 1 
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Durch einsetzen von Gl. (A.18) in Gl. (A.16) ergibt sich folgende Berechnungs- 
vorschrift für DM, 
seme Kon + nr — Ind +H 


n = n—2 „2 
-1°n-1 


(A.19) 


Da Gl. (A.19) nur rekursiv berechenbare Größen enthält, ist dies somit eine 
rekursive Berechnungsvorschrift für CML. Der CML-Schätzwert der Varianz 
Oe ist nach (SS11) durch 


n 


52 CML _ re (x1 u 
t=2 
1 n 
=] E bs -(1-0)m-6%-1] 
; = (A.20) 
2 222, 92.2 
= ze +(1-$) Xa tO X 


2(1—o)Xnx +2(® RX 
—26x%,x-1] 


gegeben. Die Berechnung der mittleren Summe der Quadrate ab der zweiten 
Beobachtung erfolgt mit: 


1 ar 
ale et i 


(A.21) 
te 
Damit folgt für Gl. (A.20) weiter 
ô? a =x, + (1 = 9,2 +0 (Pat +7) 
- 21-6) (in) (A.22) 
n—]1 n 


+2(6 - Q?) EnEn - 2622, 


Mit Gl. (A.22) kann somit die rekursive Berechnung des Schätzwertes erfolgen. 
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A.6 Autokorrelation und -kovarianz eines 
gefilterten AR(1)-Modells 


Sei x; eine Realisierung eines AR(1)-Prozesses der Form 


Xt = x-1 +E , & ~ N (0,02). (A.23) 


Sei weiterhin x7; die durch ein PT1-Glied gefilterte Zeitreihe mit der Differen- 
tialgleichung 
Txr +XxT =x. (A.24) 


Gegeben sind drei beispielhafte Realisierungen des AR(1)-Prozesses für Os = 
1 mit 6 € {0.5,0.7,0.9}. Gegeben sind weiterhin die gefilterten Zeitreihen 
Xr, und, mit T = T; = 1 für x7, und T = D = 5 für x,,. Abb. A.5 zeigt 
einen Ausschnitt der ungefilterten und gefilterten Zeitreihen. In Tabelle A.1 
sind die Stichprobenautokorrelation rı und die Stichprobenautokovarianz Yı 
nach 1000 Zeitschritten aufgefiihrt. Deutlich zu erkennen ist die Zunahme 
der Autokorrelation sowie Abnahme der Autokovarianz der Zeitreihen mit 
wachsender Zeitkonstante T. 


Tabelle A.1: Stichprobenautokorrelation rı und -autokovarianz y; für AR(1)-Zeitreihen x, und 
deren PT} -gefilterte äquivalente x7, ‚, und x7, , mit ® = 0.5, 6 = 0.7 und @ = 0.9 sowie T; = 1 und 
R=3. 


rı(&) riers) rne) 


¢ =0.5 0.509 0.737 0.937 
¢ =0.7 0.682 0.837 0.961 
¢=0.9 0.879 0.942 0.985 


Ya) Nit) NE) 


¢ =0.5 0.708 0.688 0.314 
¢ =0.7 1.171 1.103 0.562 
¢ =0.9 3.620 3.504 2.411 
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(c) 


Abb. A.5: Autoregressiver Prozess x, sowie die durch ein PT|-Glied gefilterten Zeitreihen x7, 
und x7, ; für @ = 0.5 (a), ® = 0.7 (b) und @ = 0.9 (c). 
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A.7 Verifizierung der Parameterschatzung 


zur Fahrerwunschdynamik 


Folgend sind die zur Erzeugung der Testdaten verwendeten Ubergangswahr- 
scheinlichkeiten M sowie die zugehörigen stationären Zustandswahrscheinlich- 


keiten 7, aufgeführt. 


Ruhiger Fahrer: 
0.95 
0.0375 
Mı = |0.0625 
0.0875 
0.1125 


0.0125 
0.85 
0.0625 
0.0875 
0.1125 


0.0125 
0.0375 
0.75 
0.0875 
0.1125 


Teo, © [0.56 0.19 0.11 0.08 


Moderater Fahrer: 


0.75 
0.0375 
0.0125 
0.0375 
0.0625 


0.0625 
0.85 
0.0125 
0.0375 
0.0625 


0.0625 
0.0375 
0.95 
0.0375 
0.0625 


0.0125 

0.0375 

0.0625 
0.65 


0.1125 


T 
0.06 


0.0625 
0.0375 
0.0125 
0.85 
0.0625 


T 
72% [0.10 0.16 0.48 0.16 0.10 
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0.0125 
0.0375 
0.0625 
0.0875 
0.55 


0.0625 
0.0375 
0.0125 
0.0375 
0.75 


(A.25) 


(A.26) 


A.7 Verifizierung der Parameterschätzung zur Fahrerwunschdynamik 


Sportlicher Fahrer: 


0.55 0.1125 0.1125 0.1125 0.1125 
0.0875 0.65 0.0875 0.0875 0.0875 
M3 = [0.0625 0.0625 0.75 0.0625 0.0625 
0.0375 0.0375 0.0375 0.85 0.0375 
0.0125 0.0125 0.0125 0.0125 0.95 


(A.27) 


T 
Tans ~ [0.06 0.08 0.11 0.19 0.56 


Abb. A.6, A.7 und A.8 zeigen die Zustandswahrscheinlichkeiten 7, zu den 
erzeugten Testdaten, ermittelt nach 5 Iterationen des Baum-Welch-Algorithmus 
und mittels des rekursiven Verfahrens (Online-EM) nach (Cap11). In den 
Abbildungen A.9, A.10 und A.11 sind die zugehörigen Übergangsmatrizen 
abgebildet. 
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7; - Baum-Welch 
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Abb. A.6: Zustandswahrscheinlichkeiten % für Testdaten erzeugt mit Beispiel- 
Zustandsübergangsmatrix Mı. Ermittelt mit einer Schätzung der Zustandsübergangsmatrix M nach 
fünf Iterationen des Baum-Welch-Algorithmus (a) und rekursiv mit Online EM (b). 
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A.7 Verifizierung der Parameterschätzung zur Fahrerwunschdynamik 
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200 400 600 800 1000 1200 1400 1600 1800 
t [s] 
(b) 
Abb. A.7: Zustandswahrscheinlichkeiten 7%; für Testdaten erzeugt mit Beispiel- 


Zustandsübergangsmatrix Ma. Ermittelt mit einer Schätzung der Zustandsübergangsmatrix M nach 
fünf Iterationen des Baum-Welch-Algorithmus (a) und rekursiv mit Online EM (b). 
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Abb. A.8: Zustandswahrscheinlichkeiten 7, für Testdaten erzeugt mit Beispiel- 
Zustandsübergangsmatrix M3. Ermittelt mit einer Schätzung der Zustandsübergangsmatrix M nach 
fünf Iterationen des Baum-Welch-Algorithmus (a) und rekursiv mit Online EM (b). 
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(a) (b) (c) 


Abb. A.9: Ubergangsmatrix Mı (a) und die Schätzungen M nach fiinf Iterationen des Baum-Welch- 
Algorithmus (b) und rekursiv mit Online-EM (c). 


(a) (b) (c) 


Abb. A.10: Ubergangsmatrix Mz (a) und die Schätzungen M nach fünf Iterationen des Baum- 
Welch-Algorithmus (b) und rekursiv mit Online-EM (c). 
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(a) (b) (c) 


Abb. A.11: Ubergangsmatrix M3 (a) und die Schätzungen M nach fünf Iterationen des Baum- 
Welch-Algorithmus (b) und rekursiv mit Online-EM (c). 


A.8 Berechnung der Wasserstein-Distanz W, 
zwischen Sample-Verteilungen 


Gegeben sind zwei Verteilungen Yx, = {Yk}xefı,x,] Und Yr, = {Yk beef xy) Mit 


yx E€ R!. Gesucht ist die Wasserstein-Distanz W; der beiden Verteilungen. Nach 
GL. (3.77) gilt 


Wr s¥an) = | f Fie, 0) -F,0)|" ay (A.28) 


mit den Verteilungsfunktionen Fy, (y) und Fy,, (y). Die Verteilungsfunktion 
einer Sample-Verteilungen ist als Treppenfunktionen mit 


K 
Fy (vy) = ¥ Pe Ly)» 
k=1 


(A.29) 
ga 1 falls y > y(i) 
xY = 0 sonst 
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A.9 Abbildungen zur Konvergenz der Monte-Carlo-Approximation 


gegeben. Sei O = {or }refı Kı+Ko] die geordnete Menge der vereinigten Menge 
{Yx, UYx, }, sodass ox < 0; für k < 1. Da die Verteilungsfunktionen stückweise 
konstant sind, kann die Wasserstein-Distanz zwischen Yg, und Yg, dann mit 


L 
P 


: (Ok+1 — 0x) (A.30) 


Kı+K2-1 


Wo(Fir¥in)=( L Fon O) — Fh, (01) 
k=1 z 


p 


berechnet werden. 


A.9 Abbildungen zur Konvergenz der 
Monte-Carlo-Approximation 


Abbildungen zur Konvergenzuntersuchung der Monte-Carlo-Approximation, 
ergänzend zu Abschnitt 3.7.2. 


1 50 100 1 50 100 


(a) (b) 


Abb. A.12: Bewertung der Vorhersage der Längsbeschleunigung ä, abhängig von der Anzahl an 
Samples K. (a) Konvergenz: Mittelwert und Standardabweichung der Wasserstein-Distanz von 10 
Vorhersagen mit K Samples zur Referenzvorhersage mit 500 Samples. (b) Diskrepanz: Mittelwert 
und Standardabweichung der Wasserstein-Distanz zwischen 10 Vorhersagen mit X Samples. 
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1 50 100 1 50 100 


(a) (b) 


Abb. A.13: Bewertung der Vorhersage der Querbeschleunigung â, abhängig von der Anzahl an 
Samples K. (a) Konvergenz: Mittelwert und Standardabweichung der Wasserstein-Distanz von 10 
Vorhersagen mit K Samples zur Referenzvorhersage mit 500 Samples. (b) Diskrepanz: Mittelwert 
und Standardabweichung der Wasserstein-Distanz zwischen 10 Vorhersagen mit X Samples. 


1 50 100 1 50 100 
K K 


(a) (b) 


Abb. A.14: Bewertung der Vorhersage Pr der Geschwindigkeit abhängig von der Anzahl an 
Samples K. (a) Konvergenz: Mittelwert und Standardabweichung der Wasserstein-Distanz von 10 
Vorhersagen mit K Samples zur Referenzvorhersage mit 500 Samples. (b) Diskrepanz: Mittelwert 
und Standardabweichung der Wasserstein-Distanz zwischen 10 Vorhersagen mit X Samples. 


174 


A.10 Abbildungen zu Abschnitt 3.8.4 


A.10 Abbildungen zu Abschnitt 3.8.4 
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Abb. A.15: Realer Verlauf y; und die zwei Sekunden Vorhersage Î» (t — 2) für den Zeitpunkt 1 für das 
stochastische Modell (a), die Punktvorhersage (b) und die Markov-Kette (c). Die Hintergrundfarbe 
indiziert die Vorhersagegüte crps für diesen Zeitpunkt. 
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Abb. A.16: Realer Verlauf y, (Geschwindigkeit v, Längsbeschleunigung ay, Querbeschleunigung 
ay und Radleistung Pr) und die 20 Sekunden Vorhersage Yoo (t — 20) für den Zeitpunkt f für das 
stochastische Modell (a), die Punktvorhersage (b) und die Markov-Kette (c). Die Hintergrundfarbe 
indiziert die Vorhersagegiite crps fiir diesen Zeitpunkt. 
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Nomenklatur 


Abkurzungen 

Abkürzung Bedeutung 

ADAS Advanced Driver Assistance Systems 

AR Autoregressiver Prozess 

ARIMA Autoregressive Integrated Moving Average Prozess 
ASM Asynchronmaschine 

CAN Controller Area Network 

CML Conditional-Maximum-Likelihood 

CRPS Continous Ranked Probability Score 

DP Dynamische Programmierung 

E-Fahrzeug elektrisch angetriebenes Fahrzeug 

EH Elektronischer Horizont 

EM Expectation-Maximization-Methode 

ES Energy Score 

MES Mean Energy Score 

ML Maximum-Likelihood 

GDP Gross Domestic Product (Bruttoinlandsprodukt) 
GPS Global Positioning System 

GMM Gaussian Mixture Model (Gauß’sche Mischverteilung) 
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Nomenklatur 


HMM 
HUCS 
MA 
MAE 
MAPE 
MCRPS 
MPC 
MPP 
MSE 
SMPC 
PSD 
PSM 
PWARX 
RMES 
RMSE 


TLC 
UCS 
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Hidden Markov Model 
Heuristic-Uniform-Cost-Search 

Moving Average Prozess 

Mean Average Error 

Mean Average Percentage Error 

Mean Continous Ranked Probability Score 

Model Predictive Control (Modellprädiktive Regelung) 
Most Probable Path (wahrscheinlichster Pfad) 


Mean Square Error (mittlerer quadratischer Fehler) 


Stochastic Model Predictive Control 

Prädiktive Streckendaten 

Permanenterregte Synchronmaschine 

Piecewise Affine Autoregressive Models with Exogenous Input 
Root Mean Energy Score (Wurzel des mittleren Energy Score) 


Root Mean Square Error (Wurzel des mittleren quadratischen 
Fehlers) 


Time to Line Crossing 


Uniform-Cost-Search 


Formelzeichen 


Formelzeichen 


Zeichen Einheit Bedeutung 
ax 3 Längsbeschleunigung 
ay 2 Querbeschleunigung 
dy 2 modifizierte Querbeschleunigung 
Cp - spezifische Warmekapazitat 
Cw - Luftwiderstandsbeiwert 
Gr - Zeitschrittfaktor stochastischer Prozess I" 
e divers Prädiktorvariable 
ts - Systemübertragungsfunktion 
TR - Rollwiderstandsbeiwert 
fr - Transferfunktion des Vorhersagemodells 
g 2 Gravitationskonstante 
j 3 Ruck 
mm Länge 
m kg Fahrzeugmasse 
m kg Fahrzeugmasse mit Berücksichtigung der rotatorischen 
Masseanteile 
n - Anzahl Messzeitpunkte 
Nmax - Beschränkung der Messzeitpunkte für rekursive 
Lernverfahren (Lernhorizont) 
- Wahrscheinlichkeit 
au spezifische Wärmeleistung 
r m Bahnradius 
$ m Weg, Position 
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Nomenklatur 


S(.) - Segment mit Index (-) 

SID - Zielsegment 

t - Zeitindex mit Diskretisierung Ar 

t - Zeitindex bezogen auf aktuellen Zeitpunkt 

r - Zeitindex mit Diskretisierung c; r At 

tih s, min Lernhorizont (zeitlich) 

u divers Steuergröße 

v ma km Geschwindigkeit 

Viim m m Geschwindigkeitslimit 

Vax a km Freifahrtgeschwindigkeit (unbeschränkte Strecke) 
vz S Zielgeschwindigkeit 

VA me Geschwindigkeitsoffset 

x divers Systemzustand oder allgemeine Variable 

y divers Vorhersagegröße bzw. Umgebungszustand 

Z divers Störgröße 

A, s Zeitdiskretisierung 

a - Steigungswinkel (Kapitel 3) 

a Wärmeübergangskoeffizient (Abschnitt 4.3) 
E divers Rauschterm (AR-Prozess) 

n - Wirkungsgrad 

u divers Mittelwert 

A - Rekursionsgewichtungsparameter 

(0) - Autoregressionsparameter 

T - Zustandswahrscheinlichkeitsverteilung (HMM) 
Too - Stationäre Zustandsverteilung (HMM) 

T - Regelstrategie (Optimalsteuerung bzw. MPC) 
PL Ke Luftdichte 
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Formelzeichen 


o divers Standardabweichung 

y divers Parameter der Transferfunktion fr 

K + Bahnkriimmung 

V divers Beobachtungsgröße zur Ermittlung der Parameter 0 
(Kapitel 3) 

V IG Temperatur (Abschnitt 4.3) 

0 divers Prozessparameter von I’ 

© - Parameter eines HMM 

Tr - Stochastische Prozessbeschreibung für y 

A mm?, m? Fläche 

By divers Breite des zentralen p-Vorhersageintervalls 

C x Wärmekapazität 

D mm Durchmesser 

FB N Beschleunigungswiderstand 

Fr N Luftwiderstand 

Fs N Steigungswiderstand 

FR N Rollwiderstands 

Fw N Fahrwiderstand 

J - Güte-/Kostenfunktion 

K - Samplegröße 

M - Zustandsübergangsmatrix (Markov-Kette bzw. HMM) 

MK Monte-Carlo- Vorhersage einer Markov-Kette 

Nm - Diskretisierungsparameter für HUCS 

NHMM - Anzahl Zustände Hidden-Markov-Model 

O divers Beobachtungsgröße Hidden-Markov-Model 

P W, kW Leistung 

Pr kW Radleistung 
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Nomenklatur 
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divers 


alB alB |B 


divers 
divers 
divers 


divers 


Wärmestrom 

Regelgüte 

Zustandsraum einer Markov-Kette bzw. eines HMM 
Menge aller Segmente des Most Probable Path 


Horizont (Schritte) der Vorhersage bzw. des 
Optimalsteuerungsproblems 


Segmentbaum des elektronischen Horizonts 


Zeitabhängiger Zustand einer Markov-Kette bzw. eines 
HMM 


Monte-Carlo-Vorhersage des stochastischen Modells 
Punktvorhersage des stochastischen Modells 
Zulässiger Bereich der Steuergrößen 

Zielfunktion 

Verteilungsfunktion der Zielgeschwindigkeit 
Verteilungsfunktion der Zielgeschwindigkeit 
Verteilungsfunktion der Freifahrtgeschwindigkeit 
Wasserstein-Distanz der Ordnung p 

Verteilung eines Systemzustands 

Zulässiger Zustandsraum 


Verteilung einer Vorhersagegröße bzw. des 
Umgebungszustands 


Mathematische Schreibweisen 


Mathematische Schreibweisen 


Notation Bedeutung 
xT Transponierte von x 
Wert an der Stelle y des Vektors x.y € Nt 
xD) ta der Funktion x an der Stelle y 
x= f(y) x ist eine von y abhängige Funktion 
{x1,x2,...} Menge 
{ee eee Kardinalitat einer Menge 
x Zeitreihe 
Xt Wert einer Zeitreihe x zum Zeitpunkt t 
XET Werte [x1,x2,...,xr] der Zeitreihe x 
Xi Indizierung 
() Zeitableitung 
(-)* Optimaler Wert bzw. optimale Ausprägung von (-) 
(-)max Maximalwert 
(min Minimalwert 
© Mittelwert 
() Schätzwert oder Vorhersage 
(+) Erwartungswert 
o(:.) Standardabweichung 
x~X x folgt der Verteilung oder dem stochastischen 
Prozess X 
AAB Aussage A und Aussage B 
AVB Aussage A und/oder B 
N (u, 0?) Normalverteilung mit Mittelwert u und Varianz o? 
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Nomenklatur 


U(a,b) 
min(-), min,(-) 


arg min(-) 


u.d. N. 
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Gleichverteilung auf dem Interval [a,b] 
Minimum von (-) über alle Möglichkeiten für x 
Argument welches (-) minimiert 
Heaviside-Funktion 

Heaviside-Funktion 1(x— a) 

Dirac-Funktion 

Dirac-Funktion ô(x — a) 

Wahrscheinlichkeit von (-) 

Verteilungsfunktion 
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